平均値 $\mu^*$,分散 $\sigma^{2*}$ をもつ,任意の分布に従う乱数列 $x_1, x_2, \dots, x_n$ があるとき,その平均値
\[ \bar{x}_n = \frac{x_1+x_2+\cdots+x_n}{n} \] の確率分布は,$n$ が大きくなるとき,平均値 $\mu^*$,分散 $\sigma^{2*}/n$ である正規分布に収束する。
すなわち,
\[ \frac{\bar{x}_n-\mu^*}{\sigma^*\ /\ \sqrt{n}} \] は,$n$ が大きいとき,平均値 $0$,分散 $1$ の標準正規分布に従うとみなしてよい。
これを,中心極限定理 という。
例えば,一様乱数は,平均 $E(x) = 1 / 2$,分散 $V(x) = 1 / 12$ であるから,$12$ 個の一様乱数の合計は平均値が $12/2=6$,分散は $12/12=1$ なので, $12$ 個の一様乱数の合計から $6$ を引くだけで簡単に,標準正規分布に従う正規乱数が発生できる。
> x < matrix(runif(120000), 12) # 12×10000の一様乱数行列 > z < colSums(x)-6 # 列和から6を引く。結果は10000個の正規乱数 > mean(z) # 平均値 [1] -0.00339625 > var(z) # 不偏分散 [1] 1.012838 > sd(z) # 標準偏差 [1] 1.006399
演習問題:
応用問題: