📝 CONCEPT/Statistics

#5. 실수값을 위한 확률밀도함수

쟈니유 2023. 6. 5. 16:44
728x90

Reference

  • 프로그래머를 위한 확률과 통계 

 

확률밀도함수 

  • 가정 : 긴 종이에 잉크의 농담을 조절하며 인쇄하고 있다고 가정 
  • X = 실수값의 확률변수 
  • 누적분포함수 (잉크의 총량)
    • F(x) = x까지의 잉크의 총량 = P(X<=x) = x까지의 확률의 총량 
  • 확률밀도함수 (잉크의 농도)
    • f_X(x) = F'_X(x) = dF_x(x) / dx 
      • f_X(x) :  x 지점에서 잉크의 농도 (그래프 상에서는 면적)
      • F'_X(x) : 누적분포함수에서의 기울기 즉 잉크의 증가량  
    • 누적분포함수에서 특정 구간의 기울기 = 해당 영역의 잉크의 농도, 즉 확률의 밀도 

 

위키백과

 

  • 주의해야할 것은, 확률 분포가 확률밀도 함수로 주어졌을때 '정확한 어떤 값'이 될 확률은 항상 0이다.
  • 그러므로 해당 변수가 구간에 포함될 확률(=밀도,부피 등으로 계산)을 적분으로 계산하여 구한다 

 

 

 

확률밀도함수의 변수 변환 

문제

확률변수 X의 분포를 알고 있는데 이 분포를 Y=g(X)로 변환한다. 이 때 Y의 분포는 ?

 

f_Y(y) = |f_X(x) / g'(x)| 

 

착안점

  • 잉크가 인쇄된 밴드의 넓이가 3배 늘어나면 그 잉크의 농도는 1/3배로 줄어든다
  • 그러므로 증가량인 g'(x)로 원래의 밀도인 f_X(x)를 나눠주면 잉크 농도가 변화한 값이 도출된다 

 

그러므로 아래처럼 이해할 수 있다. 

 

  • f_Y(y) = f_X(x) * |1/g'(x)| = f_X(x) * |dx/dy|
  • f_Y(y) * |dy| = f_X(x) * |dx|