📝 CONCEPT/Statistics

#2. 결합확률, 주변확률, 조건부확률

쟈니유 2023. 5. 29. 22:03
728x90

확률분포 X,Y에 대해 X=a, Y=b가 될 확률을 각각 P(X=a), P(Y=b)라 가정  

1. 결합확률

  • X=a, Y=b가 동시에 될 확률 P(X=a,Y=b) 
  • 여러 조건을 지정하고 모든 조건이 동시에 각각 성립하는 것 
  • 결합분포의 모든 조합에 대한 확률을 합하면 1이 됨 ∑_a∑_b P(X=a,Y=b) = 1

 

2. 주변확률

  • 각각 X=a, Y=b가 될 단독확을 주변확률이라고 하며 이는 P(X=a), P(Y=b) 처럼 각각 나타냄 
  • 결합분포에서 주변분포를 계산할 수 있음 (반대는 X)
  • P(X=a) = ∑_b P(X=a,Y=b) : Y가 취할 수 있는 모든 값 b를 X=a일때 계산하여 합산 
  • P(Y=b) = ∑_a P(X=a,Y=b) : X가 취할 수 있는 모든 값 a를 Y=b일때 계산하여 합산

 

+ 예시 

카드 16장이 있고 각 카드는 색상 (빨강, 검정), 종류 (숫자, 그림)의 특성을 갖고 있다. 이 때 색깔을 X, 종류를 Y라고 하면 

X,Y의 결합분포는 다음과 같이 나타낼 수 있다 (확률은 임의). 

  Y=숫자 Y=그림 
X=빨강 3/16 6/16
X=검정 6/16 1/16

X의 주변분포는 다음과 같다. 

  • P(X=빨강) = P(X=빨강, Y=숫자) + P(X=빨강, Y=그림) = 3/16 + 6/16 
  • P(X=검정) = P(X=검정, Y=숫자) + P(X=검정, Y=그림) = 6/16 + 1/16 

 

3. 조건부확률 

  • A일 때 B일 확률 P(B|A) 
  • P(Y=b|X=a) = P(X=a,Y=b) / P(X=a) : X=a일때 Y=b일 조건부확률은 X=a일 때 X=a이고Y=b인 결합확률을 계산하는 것 
  • ∑_b P(X=b|Y=a) = 1 
    • Y=a가 주어졌을 때 X가 취할 수 있는 모든 b의 확률을 합치면 1 
    • 단 ∑_a P(X=b|Y=a)는 분모가 다르므로 1이 되지 않음 

+ 예시 

동일한 카드의 결합/주변분포를 가지고 있을 때, X=빨강이라는 조건하의 Y의 조건부 분포 

  • {X=빨강이라는 조건 하에서 Y=숫자 카드일 조건 부 확률} = X=빨강, Y=숫자인 결합확률 / X=빨강일 확률 = (3/16) / (9/16) 
  • {X=빨강이라는 조건 하에서 Y=그림 카드일 조건 부 확률} = X=빨강, Y=그림인 결합확률 / X=빨강일 확률 = (6/16) / (9/16) 

 

4. 결합확률분포, 주변확률분포, 조건부확률분포 간의 관계 

결합분포와 주변분포 

P(X=a) = ∑_b P(X=a, Y=b) : X=a가 고정일 때 모든 b의 확률을 더한 것이 주변분포가 됨 

 

결합분포 with 주변분포와 조건부분포 

P(X=a,Y=b) = P(X=a|Y=b) * P(Y=b) = P(Y=b|X=a) * P(X=a) 

 

5. 확률변수가 세 개 이상일 때 

P(a,b,c) = P(a|b,c) * P(b,c) = P(a|b,c)*P(b|c)*P(c)