📝 CONCEPT/Statistics

#1. 확률과 확률변수, 그리고 확률 분포

쟈니유 2023. 5. 29. 21:23
728x90

Reference

  • 프로그래머를 위한 확률과 통계 

 

 

1. 확률

  • 표본 [ω] : 전체 모집단으로 부터 관찰한 관측값들의 집합 (ex. 평행세계속 하나의 평행 세계)
  • 표본공간[Ω] : 측정/관찰 가능한 모든 값들의 집합 (ex. 전체 평행세계)
  • 사건 [A] : 표본공간의 부분집합으로 특정 조건을 만족시키는 표본점들의 집합 (ex. 동전을 던졌을때 앞면이 나온다) 
  • P(A): A의 면적 (전체 측정/관찰 가능한 값 중 A가 발생하는 영역의 비) (ex. P(동전 앞면) = 0.5) 
  • 확률 표기법
    • P(X=a) : X(ω)=a가 되는 ω의 집합 

 

2. 확률변수

  • 확률 변수 정의
    • 표본공간Ω 위의 함수로, 표본공간의 각 요소인 표본ω에 정수값을 반환하는 f(ω)가 있다면 이것은 정수의 확률 변수 
    • 즉 어떤 세계(ω)에서 어떤 값(정수값)이 나올 지 정함 
    • 예를들어 확률변수 X(u,v)가 있을 때 0 <= v <= 1/4 일때 당첨, 1/4 <= u <=1 일때 탈락으로 정의
  • 확률 변수 표기법
    • X(ω) = a : 점 w의 함수 X의 값이 a 
  • 이산확률변수에서는 확률질량함수(Pmf), 연속확률변수에서는 확률밀도함수(Pdf)를 계산한다 

 

3. 확률 분포 

  • P(X=k) : X(ω)=a가 되는 ω의 영역의 면적 (당첨이 되는 ω영역의 면적) 
  • X가 k가 될 확률을 정렬한 목록이 X의 확률 분포 
  • 예시 (확률변수 X의 확률분포) 
그 값이 나올 확률 확률분포 식
당첨 1/4 P(X=k) = 1/4 (k= 당첨)
탈락 3/4 P(X=k) = 3/4 (k= 탈락)
  • 특징
    • 확률변수 X가 주어지면 확률 분포를 구할 수 있음
    • 확률은 0이상1이하이며 모두 합하면 반드시 1이 됨 

 

📝정리

 

  • 확률은 면적이다 (구하고자 하는 경우의 면적 / 전체 면적)
  • 확률변수는 표본공간 안에서 작동하는 함수이다 
  • 확률분포란 확률변수가 가질 수 있는 모든 값들과 그 값이 될 수 있는 확률값들의 집합이다