통계

[기초통계] 기술통계 - 표본분포

dontgive 2024. 1. 22. 10:41
728x90

모집단과 표본집단

모수 (parameter) : 모집단의 특성을 나타내는 값

 

대표적으로 모평균과 모표준편차가 있다.

 

통계량(statistics) : 표본집단의 특성을 나타내는 값

 

대표적으로 표본 평균과 표본 표준편차가 있다.

표본 평균의 표본분포

모집단에서 추출한 표본들의 평균이 어떻게 확률적으로 분포하는지(표본분포)를 나타내기 위해 확률변수 x̄ 를 사용한다.

중심극한 정리 (Central Limit Theorem)

i.i.d.한 Xi가 존재하고, Xi ~ F인 모집단 F의 평균(µ)과 분산(σ^2)이 유한한 값으로 정의되면 
동일분포들의 평균은 (i.e. 표본 평균 x̄) 의 분포는 F와 관계 없이(regardless of population distribution)
N(µ, σ^2/n) 인 정규분포를 따른다.

wikipedia

중심극한정리는 분포와 관계없이 표본의 수가 적당히 크다면 (보통 30 이상)

표본분포들의 표본평균의 분포가 정규분포를 따른다는 것을 의미한다.

이후 정규분포 근사를 통해 통계적 추정 등을 진행할 수 있다.

 

큰수의 법칙 (Law of Large Numbers)

the average of the results obtained from a large number of independent and identical random samples converges to the true value, if it exists. - wikipedia -

 

표본의 크기가 커짐에 따라 표본은 모평균을 더 닮아간다는 것을 나타낸다.

Weak law of large numbers

 

표본비율 (Sample Proportion)

N개의 모집단에서 표본의 크기가 n인 표본추출을 하는 상황에서

표본의 크기 n 중 성공으로 나타나는 개체수(X)의 비율을 표본비율이라고 한다.

모비율

모집단에서 성공으로 나타나는 개체수의 비율

 

표본비율의 표본분포 (Sampling distribution of sample proportion)

모비율과 비슷한 표본비율을 가진 표본들이 추출될 가능성은 클 것으로 기대되지만 그 반대는 희박할 것이 예상되는 경우 표본으로 추출될 가능성이 있는 모든 표본비율의 값을 표본분포라고 정의

 

구체적인 설명은 아래 페이지에서 더 자세하게 살펴볼 수 있다.

https://www.statisticshowto.com/sample-proportion/

728x90

'통계' 카테고리의 다른 글

점 추정 (Point Estimate)  (2) 2024.01.25
[기초통계] 기술통계 - 확률분포  (2) 2024.01.22
[기초통계] 기술통계 - 표본추출  (0) 2024.01.21