[STATISTICS] 중심극한정리 (Central limit theorem, CLT)

3월 31, 2018

Q: 중심극한정리가 무엇인가
A: 충분한 수가 있으면 평균에 가까워지는거..?  → 오답이다. 


중심극한정리는 평균이 μ, 분산이 σ**이고, 표본의 크기가 충분히 크다면 (적어도 30개 이상) 표본평균의 분포가 정규분포와 근사하게 되는 것이다.

아래는 우리가 일반적으로 아는 히스토그램이다.
   
[그림1] 두 주사위의 눈의 합 히스토그램

[그림1]은 두 개의 주사위를 n번 던졌을 때 나오는 눈의 합이 나오는 갯수이다. 
주사위를 많이 던질수록, 즉 반복 횟수가 많아 질수록 평균의 분포는 아래에 있는[그림2] 확률 히스토그램으로 수렴한다. 이를 평균의 법칙이라고 한다.

[그림2] 두 주사위 눈의 합의 확률 히스토그램

[그림2]는 주사위 두 개를 던졌을 때 나오는 눈의 합의 확률을 히스토그램으로 나타낸 것이다. 이를 확률 히스토그램이라고한다.
확률 히스토그램은 표본의 수가 많아질수록, 추출횟수가 증가함에 따라 정규분포곡선으로 수렴한다. 
이를 중심극한 정리라고한다.

표본평균은 모집단의 평균과 같다고 봐도 무방하기 때문에 모집단이 정규분포이면 표본평균의 분포도 정규분포이다. 
모집단이 정규분포가 아니더라도 표본의 크기가 30이상이라면 표본의 크기가 커질수록 표본평균의 분포는 모집단의 분포와 상관없이 정규분포와 가까워진다.

댓글 없음:

[SAS base] CramBible A00-211 #1

#1. The SAS data set SASUSER.HOUSES contains a variable PRICE which has been assigned a permanent label of "Asking price". Whi...

Powered by Blogger.