표본평균의 분포
수학이야기/확률통계 2011. 6. 17. 13:15모집단의 어떤 특성을 나타내는 확률변수의 확률분포를 모집단분포라 하고, 그 확률변수의 평균, 분산, 표준편차를 각각 모평균, 모분산, 모표준편차라고 한다.
한편, 어떤 모집단에서 크기가 $n$인 표본 $X_1 , X_2 , X_3 , \cdots , X_n$을 임의추출하였을 때,
$$\bar{X}=\frac{1}{n}(X_1 + X_2 + X_3 + \cdots + X_n )$$
$$S^2 =\frac{1}{n-1}{ (X_1 -\bar{X})^2 + (X_2 -\bar{X})^2 + \cdots + (X_n -\bar{X})^2 }$$
을 각각 표본평균, 표본분산이라 하고, $S(\geq 0)$를 표본표준편차라고 한다.
모집단의 특성을 추출한 표본으로 알아내기 위해선 모집단과 표본 사이의 관계를 알아야 한다. 그를 위해 표본평균($\bar{X})$의 분포가 어떤가를 알아내야 한다.
주머니 안에 $1, 2, 3$이 적힌 공이 각각 $100$ 개씩 들어있을 때 크기가 $n$인 표본을 뽑아 모집단의 평균을 알아내고자 한다고 하자.
아래는 크기가 각각 $1, 2, 3, 4$인 표본을 복원추출할 때, 표본평균의 분포를 적은 것이다. $E(\bar{X})$와 $V(\bar{X})$를 각각 구해보자.
$\bar{X}$ |
$ 1$ |
$ 2$ |
$ 3$ |
계 |
$P(X=\bar{X})$ |
$$\frac{1}{3}$$ |
$$\frac{1}{3}$$ |
$$\frac{1}{3}$$ |
$ 1$ |
$\bar{X}$ |
$1$ |
$ 1.5$ |
$ 2$ |
$ 2.5$ |
$ 3$ |
계 |
$P(X=\bar{X})$ |
$$\frac{1}{9}$$ |
$$\frac{2}{9}$$ |
$$\frac{3}{9}$$ |
$$\frac{2}{9}$$ |
$$\frac{1}{9}$$ |
$ 1$ |
$\bar{X}$ |
$1$ |
$$\frac{4}{3}$$ |
$$\frac{5}{3}$$ |
$2$ |
$$\frac{7}{3}$$ |
$$\frac{8}{3}$$ |
$3$ |
계 |
$P(X=\bar{X})$ |
$$\frac{1}{27}$$ |
$$\frac{3}{27}$$ |
$$\frac{6}{27}$$ |
$$\frac{7}{27}$$ |
$$\frac{6}{27}$$ |
$$\frac{3}{27}$$ |
$$\frac{1}{27}$$ |
$1$ |
$\bar{X}$ |
$1$ |
$$\frac{5}{4}$$ |
$$\frac{6}{4}$$ |
$$\frac{7}{4}$$ |
$2$ |
$$\frac{9}{4}$$ |
$$\frac{10}{4}$$ |
$$\frac{11}{4}$$ |
$3$ |
계 |
$P(X=\bar{X})$ |
$$\frac{1}{81}$$ |
$$\frac{4}{81}$$ |
$$\frac{10}{81}$$ |
$$\frac{16}{81}$$ |
$$\frac{19}{81}$$ |
$$\frac{16}{81}$$ |
$$\frac{10}{81}$$ |
$$\frac{4}{81}$$ |
$$\frac{1}{81}$$ |
$1$ |
일반적으로 다음과 같은 성질이 성립한다.
모평균 $m$, 모표준편차 $\sigma$인 모집단에서 크기가 $n$인 표본을 임의추출할 때, 표본평균 $\bar{X}$에 대하여 다음이 성립한다.
1. $\displaystyle{E(\bar{X})=m, V(\bar{X})=\frac{\sigma^2}{n} ,\sigma(\bar{X})=\frac{\sigma}{\sqrt {n}}}$
2. 모집단이 정규분포를 따르면 $n$의 크기에 상관없이 $\bar{X}$는 정규분포 $\displaystyle{N(m, \frac{\sigma^2 }{n})}$을 따른다.
3. 모집단이 정규분포가 아니더라도 표본의 크기 $n$이 충분히 크면 $\bar{X}$는 정규분포 $\displaystyle{N(m, \frac{\sigma^2 }{n})}$에 가까워진다.
위 분포를 히스토그램으로 나타내면 아래와 같다. 표본의 크기가 클수록 모평균과 비슷한 평균을 가지는 표본을 뽑을 확률이 커짐을 볼 수 있다. 표본평균 $\bar{X}$와 표본평균의 평균 $E(\bar{X})$ 또는 표본분산($S^2 $)과 표본평균의 분산($V(\bar{X})$)을 혼동하는 일이 없도록 조심하자.