正規分布の由来     Last modified: May 16, 2002

 中心極限定理から正規分布に従う乱数列を作ったように,いくつかの確率変数の和は正規分布に従う。それらの確率変数は必ずしも同じ分布に従っていなくてもよい。このように考えると,例えば,身長や体重を決める遺伝子や生育条件( 食生活など )は無数に存在する。このような原因の総和である結果としての身長や体重が正規分布に従うことも理解できるであろう(体重は環境条件の影響を受けやすいので,分布は身長の場合よりも正規分布からずれている。すなわち,後天的影響を受けない特性の方が,分布はより正規型に近いといわれる)。また,工業製品の品質( 重さ,長さなど )の誤差は原材料や工程での微妙な差が累積されたものであると考えられる。このような観点から Gauss は,「正規分布は偶然誤差の分布法則である」ととらえた。

 $x$ の分布が二項分布であるとき,$n$ が大きく,$n\ p\ ( 1 - p )$ もある程度大きければ,次式が成り立つ( ただし,$Z$ は標準正規変数 )。これは,ラプラスの定理と呼ばれる。 \[ \Pr \left \{ a \lt \frac{X-n\ p}{\sqrt{n\ p\ (1-p)}} \lt b \right \} ≒\Pr\{a \lt Z \lt b\} \]  ラプラスの定理は,中心極限定理の特別な場合である。すなわち,試行回数 $n$,母比率 $p$ である二項分布において,各回の試行結果を表す確率変数を $x_{1}, x_{2}, \dots , x_{n}$ とし,‘成功’を $1$,‘失敗’を $0$ としたとき,$x_{1}, x_{2}, \dots , x_{n}$ は互いに独立で,$\Pr\{x_{k} = 1\}= p$,$\Pr\{x_{k} = 0\}= 1 - p$ である同一の分布に従い,$E(x_{k}) = p$,$V(x_{k}) = p ( 1 - p )$ である。したがって, \[ \lim_{n\rightarrow\infty} \frac{x_1+x_2+\dots +x_n-n\ p}{\sqrt{n}\ \sqrt{p\ (1-p)}} \rightarrow \mathcal{N}(0, 1^2) \] となる。$X= x_{1} + x_{2} + \dots + x_{n}$ であるからラプラスの定理が得られる。


演習問題


応用問題


・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI