표본평균의 분포

수학이야기/확률통계 2011. 6. 17. 13:15
반응형

모집단의 어떤 특성을 나타내는 확률변수의 확률분포를 모집단분포라 하고, 그 확률변수의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라고 한다.

한편, 어떤 모집단에서 크기가 $n$인 표본 $X_1 , X_2 , X_3 , \cdots , X_n$을 임의추출하였을 때,

$$\bar{X}=\frac{1}{n}(X_1 + X_2 + X_3 + \cdots + X_n )$$

$$S^2 =\frac{1}{n-1}{ (X_1 -\bar{X})^2 + (X_2 -\bar{X})^2 + \cdots + (X_n -\bar{X})^2 }$$

을 각각 표본평균, 표본분산이라 하고, $S(\geq 0)$를 표본표준편차라고 한다.

모집단의 특성을 추출한 표본으로 알아내기 위해선 모집단과 표본 사이의 관계를 알아야 한다. 그를 위해 표본평균($\bar{X})$의 분포가 어떤가를 알아내야 한다.

주머니 안에 $1, 2, 3$이 적힌 공이 각각 $100$ 개씩 들어있을 때 크기가  $n$인 표본을 뽑아 모집단의 평균을 알아내고자 한다고 하자.

아래는 크기가 각각 $1, 2, 3, 4$인 표본을 복원추출할 때, 표본평균의 분포를 적은 것이다. $E(\bar{X})$와 $V(\bar{X})$를 각각 구해보자.

 $\bar{X}$

$ 1$

$ 2$

$ 3$

 계

 $P(X=\bar{X})$

 $$\frac{1}{3}$$

  $$\frac{1}{3}$$

  $$\frac{1}{3}$$

$ 1$


  $\bar{X}$

 $1$

$ 1.5$

$ 2$

$ 2.5$

$ 3$

 계

  $P(X=\bar{X})$

$$\frac{1}{9}$$

 $$\frac{2}{9}$$

 $$\frac{3}{9}$$

 $$\frac{2}{9}$$

 $$\frac{1}{9}$$

$ 1$


$\bar{X}$

$1$

$$\frac{4}{3}$$

$$\frac{5}{3}$$

$2$

$$\frac{7}{3}$$

$$\frac{8}{3}$$

$3$

 계

$P(X=\bar{X})$

$$\frac{1}{27}$$

$$\frac{3}{27}$$

$$\frac{6}{27}$$

$$\frac{7}{27}$$

$$\frac{6}{27}$$

$$\frac{3}{27}$$

$$\frac{1}{27}$$

$1$


$\bar{X}$

$1$

$$\frac{5}{4}$$

$$\frac{6}{4}$$

$$\frac{7}{4}$$

$2$

$$\frac{9}{4}$$

$$\frac{10}{4}$$

$$\frac{11}{4}$$

$3$

$P(X=\bar{X})$

$$\frac{1}{81}$$

$$\frac{4}{81}$$

$$\frac{10}{81}$$

$$\frac{16}{81}$$

$$\frac{19}{81}$$

$$\frac{16}{81}$$

$$\frac{10}{81}$$

$$\frac{4}{81}$$

$$\frac{1}{81}$$

$1$

일반적으로 다음과 같은 성질이 성립한다.

모평균 $m$, 모표준편차 $\sigma$인 모집단에서 크기가 $n$인 표본을 임의추출할 때, 표본평균 $\bar{X}$에 대하여 다음이 성립한다.

1. $\displaystyle{E(\bar{X})=m, V(\bar{X})=\frac{\sigma^2}{n} ,\sigma(\bar{X})=\frac{\sigma}{\sqrt {n}}}$

2. 모집단이 정규분포를 따르면 $n$의 크기에 상관없이 $\bar{X}$는 정규분포 $\displaystyle{N(m, \frac{\sigma^2 }{n})}$을 따른다.

3. 모집단이 정규분포가 아니더라도 표본의 크기 $n$이 충분히 크면 $\bar{X}$는 정규분포 $\displaystyle{N(m, \frac{\sigma^2 }{n})}$에 가까워진다.

위 분포를 히스토그램으로 나타내면 아래와 같다. 표본의 크기가 클수록 모평균과 비슷한 평균을 가지는 표본을 뽑을 확률이 커짐을 볼 수 있다. 표본평균 $\bar{X}$와 표본평균의 평균 $E(\bar{X})$ 또는 표본분산($S^2 $)과 표본평균의 분산($V(\bar{X})$)을 혼동하는 일이 없도록 조심하자.




반응형