정규분포
정규분포는 연속확률분포에서 가장 많이 사용되는 분포이다.
평균에 대해서 좌우 대칭 모양이며 평균값의 분포가 가장 높아 종모양을 띈다.
평균과 표준편차에 따라 정규분포의 모양은 조금씩 다르다.
중심극한정리
중심극한정리란 표본의 크기가 커질수록 표본 평균의 분포는 모집단의 분포 모양과는 관계없이 정규분포에 가까워지는 것을 말한다.
다시 말해 표본 평균의 평균은 모집단의 모평균과 같고, 표본 평균의 표준 편차는 모집단의 모 표준 편차름 표본 크기의 제곱근으로 나눈 것과 같다는 것이다.
여기서 중요한 부분은 '표본의 크기가 커질수록' 인데 그렇다면 최소한 몇개의 표본을 가지고 있어야 중심극한정리가 성립되는지 궁금했다.
찾아보니 보통 30개 이상은 넘어야 하는 것으로 보고 있는데 실제로 도메인이나 분석 목적에 따라서 최소 기준은 다르게 잡아도 무방하다고 한다.
단, 크기가 크면 클수록 더 정확한 정규분포를 띄는 것은 사실이다. (= 다다익선)
'기초통계' 카테고리의 다른 글
[기술통계] 모집단과 표본집단, 샘플링 방법 (1) | 2024.06.04 |
---|---|
[분포] 분산과 표준편차, 사분위, 변동계수, 왜도, 첨도 (1) | 2024.06.04 |
[대표값] 평균(Mean) vs 중앙값(Median) vs 최빈값(Mode) (0) | 2024.06.03 |