📝 CONCEPT/Statistics

#9. 다변량 정규분포

쟈니유 2023. 6. 14. 16:12
728x90

정규분포가 여러개 있는 다차원의 정규분포를 의미 

 

1. 다변량 표준정규분포

  • 가정 : 표준정규분포를 따르는 i.i.d한 확률변수 Z1,Z2,,,Zn을 늘어놓은 열 벡터 Z가 따르는 분포를 n차원의 표준분포라고 함 
  • Z의 확률밀도 함수

  • Z의 기댓값 벡터와 공분산행렬 
    • 각각의 확률변수 Z1,Z2..Zn이 모두 표준정규분포를 따르고 독립이므로
    • E[Zn] = 0, V[Zn]=1 , Cov[Zi,Zj]=0 
    • 즉 기댓값은 n차원의 제로벡터, 공분산행렬은 n차원의 단위행렬 I가 됨 

 

2. 일반적인 다변량 정규분포 

1차원의 표준정규분포를 따르는 확률변수 Z~N(0,1)을 확대축소, 평행이동해서 여러 정규분포를 따르는 확률변수를 표현한 것 처럼

n차원의 표준정규분포를 따르는 확률변수 Z~N(o, I)를 변환해서 여러가지 변화를 나타낼 수 있음 

 

확대 축소와 평행이동

원의 중심이 이동하고 기준 원의 반지름이 변화되나 모든 방향으로 균등하게 σ배가 되어 원의 모양이 바뀌진 않음 

  • 변환 : 확률변수 Z~N(o, I) → X ≡ σZ+µ 
  • 기댓값 : E[X] = σE[Z]+ µ = µ
  • 분산 : V[X] = σ^2V[Z] = σ^2*I

 

종횡신축

축에 의해 늘어나고 줄어나는 배율을 바꿔 타원형의 분포를 만듦 

  • 변환 : 확률변수 Z~N(o, I) → X ≡ DZ+µ ~ N(µ, D^2)
  • 기댓값 : E[X] = σE[Z]+ µ = µ
  • 분산 : V[X]=D^2 , 대각성분이 σ1,σ2,..σn의 제곱인 대각행렬 
    • 변환 시, X ≡ (σ1,σ2,..σn)^T 으로 각 성분을 별개의 양의 정수로 변환
    • X = DZ, D는  σ1,σ2,..σn이 대각 성분인 대각 행렬

회전

타원을 회전한 형태의 분포가 일반적인 다변량 정규분포 

 

회전시키기 위해선 직교행렬을 곱해야 함  

  • 직교행렬 : 자기자신과 자기자신의 전치행렬을 곱했을때 단위행렬 I가 나오는 정사각 행렬 (QQ^T=Q^TQ=I) 
  • 직교행렬을 곱하는 방법 
    • 다변량 정규분포를 따르는 Z~N(o, I)에 임의의 대각행렬 D 곱해서 X ≡ DZ ~ N(o, D^2)로 변환 
    • Y = QX를 만듦 (Q는 직교행렬)
      • E[Y] = Q*E[X] = Q*o =
      • V[Y] = V[QX] = Q^2*V[X]= Q*V[X]*Q^T = Q*D^2*Q^T
    • 즉 일반적인 다변량 정규분포 Y ~ N(o ,V), (V=Q*D^2*Q^T)
      • 여기에 상수벡터 µ를 더하면 원하는 위치로 중심을 이동시킬 수 있음 

 

3. 다변량 정규분포의 확률밀도함수 

  • Z ~ N(o, I)를 따르는 확률변수일 경우 
    • 확률밀도함수 f_Z(z) = (1/√2π^n) * exp[(-1/2)*||z||^2] 
  • Y ~ N(o, V)를 따르는 확률변수일 경우 (V=Q*D^2*Q^T)
    • 확률밀도함수 f_Y(y) = (1/(√2π^n * detV)) * exp[(-1/2)*y^T*V^-1*y ] 
    • 도출

4. 다변량 정규분포의 성질 

  • 기댓값 벡터와 공분산행렬을 지정하면 분포가 정해진다
    • 당연해서 패스 
  • 상관관계가 없는 것 만으로 독립적이라고 단언할 수 있다 
    • 일반적인 확률변수 X,Y에 대해 X,Y가 서로 독립이면 Cov[X,Y]=0이나, 이 반대는 반드시 성립하진 않았다. 
    • X ≡ (X,Y)^T가 2차원 정규분포라면 Cov[X,Y]=0이라면 바로 X,Y가 서로 독립이라고 말할 수 있음 (p.261) 
      • 간단하게 보면, Cov[X,Y]=0이면 이들의 공분산행렬은 대각행렬이며 그 역행렬도 대각임.
      • 이들의 확률밀도함수는 x,y만의 수식으로 각각 분해될 수 있기 때문에 서로 독립임 (차원이 더 증가해도 마찬가지) 
  • 다변량 정규분포를 선형변환하면 다시 다변량 정규분포가 된다 

 

5. 다변량 정규분포의 조건부분포와 주변분포 

 

조건부분포(단면)

다변량 정규분포의 조건부분포는 다변량정규분포다 

 

주변분포(그림자) 

다변량 정규분포의 주변분포분포는 다변량정규분포다