例題:
「母平均値 $\mu = 140$,母標準偏差 $\sigma = 8$ である正規母集団から 20 個のデータを抽出したところ,表 1 のような結果が得られた。この測定値の中の 164 は他と比べてかなり外れているようであるが,このデータは捨てた方がよいだろうか。有意水準 5% で検定しなさい。」
133 | 134 | 134 | 134 | 135 | 135 | 139 | 140 | 140 | 140 |
141 | 142 | 142 | 144 | 144 | 147 | 147 | 149 | 150 | 164 |
検定手順:
$\displaystyle T_i = \frac{\left |\ X_i - \bar{X} \ \right |}{\sqrt{U}}$
例題では,
$\displaystyle T_{20} = \frac{\left |\ 164 - 141.7 \ \right |}{\sqrt{55.0632}} = 3.0052$
例題では,$t = 2.557$ である。
例題では,有意水準 5% で検定を行うとすれば,$X_{20} = 164$ は“外れ値”とすることになる。
注1:この検定では,1回につき1個の外れ値を検出することになる。複数個の外れ値がある場合は,最も大きなものについてまず検定を行い,それが外れ値だとすると次の段階ではそれを除いた $n-1$ 個のデータについて同じように検定を行うということを繰り返す。
注2:データを安易に棄却する(捨てる)べきではない。外れ値が生じた真の原因を突き止めてから!!
演習問題:
応用問題: