Mathematics/Probability(4)
-
[Probability] Conditional probability: causality, spurious correlation
조건부확률 P(A|B)는 사건 B가 일어날 상황에서 사건 A가 발생할 확률을 의미한다.인과 관계조건부확률로 두 변수 간의 상관관계(correlation)를 추론할 수 있지만 이를 인과관계(causality)로 추론하는 것은 매우 위험하다.그렇기 때문에, 데이터에서 추론할 수 있는 관계, 데이터 생성 원리, 도메인 지식을 기반으로 인과관계를 정확히 추론해야 한다. 인과관계를 짚고 넘어가는 이유는 데이터 분포 변화에 강건한 예측 모델을 만드는데 필요하기 때문이다.아래 그럼처럼, 상관관계 기반 예측 모델은 데이터 분포 변화에 취약한 모습을 보이는 반면, 인과관계 기반 예측 모델은 강건한 모습을 보인다.반면, 안과관계만으로는 높은 성능을 담보할 수 없다. 중첩 요인 (Confounding facto..
2024.08.03 -
[Probability] Markov Chains
1. Markov Chain Models A Markov chain model is specified by identifying: (a) the set of states S={1,⋯,m}. (b) transition probability matrix P=[p11⋯p1m⋮⋱⋮pm1⋯pmm] transition probabilities pij는 현재 state(Xn)가 i일 때, 다음 state(Xn+1)가 j가 될 확률을 의미한다. 이때, 과거 state(X1전 X1에는 ..
2024.01.19 -
[Probability] Bayesian & Likelihood
1. Bayesian Statistical Inference1.1. Terminology of Bayesian Inference x=(x1,⋯,xn): observation vector of XpΘ or fΘ: prior distributionunknown parameter distribution Θ that was assumed before observing xpΘ|X or fΘ|X: posterior distributionunknown parameter distribution Θ that was assumed after observing x1.2. Summary of Bayesi..
2023.12.11 -
[Probability] Law of Large Number & Central Limit Theorem
1. Markov and Chebyshev Inequalities 1.1. Markov Inequalities If a random variable X can only take nonnegative values, then P(X≤a)≥E[X]a,for all a>0 Proof $$Y_a = {0,if X>aa,if X≤a \\ E[Y_a] = 0 \cdot Pr(X < a) + a \cdot Pr(X \le a) \rightarrow E[Y_a] = a \cdot Pr(X \le a) \\ Pr(X \le a) = \frac{E[Y_..
2023.12.11