Home
der Wille zur Macht
취소

[수학/확률과 통계] Scipy 패키지를 이용한 검정 방법

사이파이 사용해서 검정하기 파이썬 사이파이 패키지를 사용하면 다양한 검정을 쉽게 할 수 있다. 검정통계량 분포 그리고, 누적분포함숫값 직접 계산하고 안 해도 된단 거다. 요약 이항검정 검정통계량 분포로 이항분포 사용, 베르누이확률변수 모수가설 검정 카이제곱검정 카테고리분포 모수 $\mu$ 벡터 검정 카이제곱 독립검정 두 범...

[수학/확률과 통계] 베이즈추정, 검정(testing)

베이즈추정법 : 모수 $\mu$ 의 신뢰도 분포를 나타내는 작업 핵심 아이디어 : 모수 = 확률변수 주어진 데이터를 기반으로 모수 $\mu$ 의 조건부확률분포 $p(\mu \vert x_{1}, x_{2}…x_{n})$ 을 계산하는 작업이다. 베이즈정리를 사용한다. 최대가능도추정법과의 연결점 : 가장 가능성 높은 모수를 ...

[수학/확률과 통계] 추정_기본개념, 모수추정- 모멘트방법, 최대가능도추정법

추정과 검정 추정 : 내가 들고 있는 데이터가 나온 원래 확률분포(확률변수)를 찾는 작업 검정 : 추정결과가 믿을만 한가 아닌가 알아보는 작업 추정결과 신뢰도 올리는 방법 : 더 많은 데이터를 모으면 된다. 확률분포의 추정 데이터분석 기본 가정 : 분석할 데이터는 가상의 확률변수에서 떨어져 현실세계에 실현된 ‘표본’, ‘...

[수학/확률과 통계] 베타, 감마, 디리클레분포

베타, 감마, 디리클레분포 : 분포 형상을 마음대로 조작할 수 있는 분포 분포 모숫값 조작이 가능하다. 베이지안 추정에 사용한다. 1. 베타분포 : 베르누이분포 모수 $\mu$ 의 신뢰도 분포 표본공간 : 0과 1사이 모든 실수 (0 < $x$ < 1) 모수 : a, b 특징 : 모숫값을 마음대로 조작해서, 분포...

[수학/확률과 통계] F분포, 다변수정규분포(조건부분포, 주변분포 포함)

F분포 : 카이제곱분포 표본/각각의 자유도 의 비율들이 이루는 분포 모수 : 자유도 쌍 $(N1, N2)$ 자유도 : $(N1, N2)$ 카이제곱분포 표본 = 같은 정규분포에서 얻은 표본들의 제곱합 t통계량 제곱의 분포도 자유도가 $(1,N)$ 인 F분포 따른다. # t 통계량 제곱의 분포는 F(1, N)를 따른다....

[수학/확률과 통계] 스튜던트 t분포, 카이제곱분포

t분포 (스튜던트 t분포) : t통계량 분포 팻테일 현상 보이는 데이터에 적용하기 좋은 확률분포다. (예: 주식 일간수익률 데이터) 기댓값, 정밀도, 자유도를 모수로 갖는다. 자유도는 2이상의 자연수를 쓴다. 형상은 정규분포와 비슷하다. 자유도 = 1 인 t분포는 ‘코시분포’라고 부른다. t통계량의 분포다. t통계량 ...

[수학/확률과 통계] 중심극한정리

중심극한정리 정의 기댓값이 mu 이고, 분산이 $sigma^{2}$ 이며 서로 독립인 분포 N개가 있다. 각 분포에서 나온 표본 N개의 평균(또는 합)의 분포는 N이 커질수록 기댓값이 mu이고 표준편차가 sigma/np.sqrt(n) 인 정규분포에 근사한다. 혹은 기댓값이 mu이고, 분산이 sigma^{2} 인 분포가 있다. 이...

[수학/확률과 통계] 공분산, 상관계수, 조건부 기댓값과 분산

상관관계 상관관계 정의 확률변수-확률변수 간 한 확률변숫값을 알면 다른 확률변숫값에 대한 정보 얻을 수 있는 관계 또는 두 확률변수가 서로 영향 주고받는 관계 상관관계 종류 선형 상관관계 비선형 상관관계 표본 공분산 정의 : 확률변수 벡터(표본)들이 축에서 평균적으로 떨어진 정도 전제 : ‘축’ = 확률변수 ...

[수학/메모] 다변수확률변수 공분산_메모

표본 공분산 일반적인 확률변수는 시뮬레이션(=시행) 한 번 할 때 마다 스칼라 표본 하나씩을 내놓는다. 이 표본은 확률적 데이터로, 확률변수의 확률분포에 따라 현실세계로 튕겨져 나온 ‘데이터’다. 만약 스칼라 표본을 내놓는 이러한 확률변수가 $X,Y$ 둘이 있다고 가정해보자. 표본 공분산은 $x$ 표본과 $y$ 표본이 동시에 $x$ 평균과 $y...

[수학/확률과 통계] 확률변수벡터, 결합.조건부.주변확률분포, 확률변수 독립

다변수 확률변수 벡터를 표본으로 내놓는 확률변수 결합확률분포함수는 기본적으로 다변수함수다 (입력변수 여러개-벡터 / 출력변수 1개-스칼라) 따라서 결합확률분포함수는 3d 서피스플롯 등 3차원 그래프로 나타낼 수 있다. 예컨대 P_XY(x,y) 라는 결합확률질량함수가 있다. 이 함수는 2차원 벡터 $[x, y]$ 의 확률질량값을 할당하는 함...