모집단과 표본집단
- 모집단 (Population) : 통계를 통해 알고 싶어하는 모든 집단
- 모수(parameter): 모집단의 특성 (모평균, 모분산, 모표준편차 등)
- 표본 (Sample) : 모집단의 분포, 특성을 알기 위해 모집단에서 추출된 일부 집단
- 통계량(statistic): 표본의 특성 (표본평균, 표본분산, 표본표준편차 등)
- 추론 (Inference) : 표본 통계량으로 모집단의 특성을 추론
- 추출 (Sampling) : 모집단에서 표본을 추출하는 방법
어떤 그림으로 너무 잘 표현해주신 것을 찾아서 가지고 와봤다. (출처)
샘플링(Sampling)
- 단순 샘플링 (Simple Random Sampling): 무작위로 샘플을 추출
- 층화 샘플링 (Stratified Sampling): 모집단을 몇 개의 그룹으로 나누어 각 그룹에서 랜덤으로 n개씩 추출
- 계통 샘플링 (Systematic Sampling) :모집단 데이터에 1~n 개의 번호들 임의로 매긴 다음 일정 간격마다 데이터 추출
- 군집 샘플링 (Cluster Sampling) : cluster로 모집단 데이터로 분할하고, 군집 중하나 or 여러개의 군집을 선정, 선정된 군집의 전체 데이터 사용
보통 모수가 너무 많거나 실제로 모수 전체를 구하기 쉽지 않다는 문제 등으로 대부분 sampling을 통해 표본으로 기술통계를 한다. 대통령 선거 출구조사도 그 예에 해당한다고 보면 된다.
현업에서도 샘플링은 많이 쓰이는데, 그 예로 A/B Test를 생각해볼 수 있다.
'기초통계' 카테고리의 다른 글
[기술통계] 정규분포와 중심극한정리 (1) | 2024.06.10 |
---|---|
[분포] 분산과 표준편차, 사분위, 변동계수, 왜도, 첨도 (1) | 2024.06.04 |
[대표값] 평균(Mean) vs 중앙값(Median) vs 최빈값(Mode) (0) | 2024.06.03 |