Home [수학/확률과 통계] 확률변수, 확률분포 모멘트
포스트
취소

[수학/확률과 통계] 확률변수, 확률분포 모멘트

2021-06-27 7. 확률변수, 확률변수 모멘트 복습


확률변수 변환

기존 확률변수 이용해서 새 확률변수 만드는 것.

통계량

특정 표본값 전부를 하나의 공식에 넣어서 구해낸 하나의 값

큰 수의 법칙

  • 표본평균 확률변수 기댓값은 원래 확률변수 기댓값과 같다.

$E[\bar{X}] = E[X]$

$\Rightarrow$ 표본평균은 모평균에 근사한다(큰수의 법칙)

  • 비편향 표본분산 기댓값도 원래 확률변수 분산과 같다.

$\Rightarrow$ (비편향)표본분산은 모분산에 근사한다

  • 표본 갯수 n이 무한히 많아지면 표본평균은 확률변수 기댓값(평균)과 같아진다.

    표본개수 n이 충분히 크면, 표본평균은 확률변수 기댓값의 근삿값이다.


확률변수 기술통계값 & 모멘트

확률변수 중앙값

중앙값보다 큰 값 나올 확률과 중앙값보다 작은 값 나올 확률이 0.5-0.5로 동일한 지점 값

중앙값 = 누적분포함수 역함수(0.5)

확률밀도함수 면적 0.5-0.5 되게 하는 표본공간 표본값

확률변수 최빈값

확률밀도, 확률질량이 가장 높은 값

현실 데이터로 가장 빈번하게 나오게 될 값이다.

확률변수 기댓값

얻어질 거라 기대(예측)되는 값

확률변수 분산

기대. 예측의 신뢰도

분산값이 크면 : 예측 신뢰도 낮을 것이다.

분산값이 작으면 : 예측 신뢰도 클 것이다.

확률변수 확률분포의 비대칭도

확률변수의 3차 모멘트 값에서 계산

비대칭도 0 이면 좌우대칭

비대칭도 + 이면 기댓값 기준 오른쪽 표본들에 할당된 확률값들이 높다.

비대칭도 - 이면 기댓값 기준 왼쪽 표본들에 할당된 확률값들이 높다.

확률변수 확률분포의 첨도(뾰족도)

확률변수의 4차 모멘트 값에서 계산

확률분포 모양이 얼마나 뾰족한가?(확률값들이 얼마나 중앙에 모였나?)

정규분포가 기준

확률분포가 정규분포보다 중심에 모여있으면 : 첨도 양수 +

확률분포가 정규분포보다 중심에서 멀면 : 첨도 음수 -


확률변수의 독립

두 확률변수가 서로 영향 미치지 않는다!

서로 영향 미치면 = 두 확률변수는 ‘종속’

편향표본분산은 대체로 확륩변수 분산보다 작다(경향성).

비편향표본분산은 실제 확률변수 분산의 근삿값이다.

  • 이는 표본데이터들이 편향되어 있어서 그렇다. = 표본데이터들은 대체로 한 쪽에 몰려 나오는 경우가 많다.