기초통계

[기술통계] 모집단과 표본집단, 샘플링 방법

DAdiary 2024. 6. 4. 16:48

모집단과 표본집단

  • 모집단 (Population) : 통계를 통해 알고 싶어하는 모든 집단
  • 모수(parameter): 모집단의 특성 (모평균, 모분산, 모표준편차 등)
  • 표본 (Sample) : 모집단의 분포, 특성을 알기 위해 모집단에서 추출된 일부 집단
  • 통계량(statistic): 표본의 특성 (표본평균, 표본분산, 표본표준편차 등)
  • 추론 (Inference) : 표본 통계량으로 모집단의 특성을 추론
  • 추출 (Sampling) : 모집단에서 표본을 추출하는 방법

 

어떤 그림으로 너무 잘 표현해주신 것을 찾아서 가지고 와봤다. (출처)

 

 

 


샘플링(Sampling)

  • 단순 샘플링 (Simple Random Sampling): 무작위로 샘플을 추출
  • 층화 샘플링 (Stratified Sampling): 모집단을 몇 개의 그룹으로 나누어 각 그룹에서 랜덤으로 n개씩 추출
  • 계통 샘플링 (Systematic Sampling) :모집단 데이터에 1~n 개의 번호들 임의로 매긴 다음 일정 간격마다 데이터 추출
  • 군집 샘플링 (Cluster Sampling) : cluster로 모집단 데이터로 분할하고, 군집 중하나 or 여러개의 군집을 선정, 선정된 군집의 전체 데이터 사용

출처)https://www.scribbr.com/methodology/sampling-methods/

 

보통 모수가 너무 많거나 실제로 모수 전체를 구하기 쉽지 않다는 문제 등으로 대부분 sampling을 통해 표본으로 기술통계를 한다. 대통령 선거 출구조사도 그 예에 해당한다고 보면 된다.

현업에서도 샘플링은 많이 쓰이는데, 그 예로 A/B Test를 생각해볼 수 있다.