スミルノフ・グラブス検定     Last modified: Aug 2015

例題

 「母平均値 $\mu = 140$,母標準偏差 $\sigma = 8$ である正規母集団から 20 個のデータを抽出したところ,表 1 のような結果が得られた。この測定値の中の 164 は他と比べてかなり外れているようであるが,このデータは捨てた方がよいだろうか。有意水準 5% で検定しなさい。」

表 1.どのデータが“外れている”か
133 134 134 134 135 135 139 140 140 140
141 142 142 144 144 147 147 149 150 164
標本平均=141.7  標本分散=55.0632


検定手順:

  1. 前提

  2. 標本の大きさを $n$,標本データを,$X_1, X_2, \dots, X_n$ とする。

  3. 標本平均を $\bar{x}$,不偏分散を $U$ とする。

  4. 最大の測定値 $X_i$ について次式による $T_i$ を求める(平均値より小さい方の外れ値の場合には,最小の測定値について計算する)。

    $\displaystyle T_i = \frac{\left |\ X_i - \bar{X} \ \right |}{\sqrt{U}}$

    例題では,

    $\displaystyle T_{20} = \frac{\left |\ 164 - 141.7 \ \right |}{\sqrt{55.0632}} = 3.0052$

  5. 統計数値表から有意点 $t$ を求める。

    例題では,$t = 2.557$ である。

  6. 帰無仮説の採否を決める。

    例題では,有意水準 5% で検定を行うとすれば,$X_{20} = 164$ は“外れ値”とすることになる。

注1:この検定では,1回につき1個の外れ値を検出することになる。複数個の外れ値がある場合は,最も大きなものについてまず検定を行い,それが外れ値だとすると次の段階ではそれを除いた $n-1$ 個のデータについて同じように検定を行うということを繰り返す。

注2:データを安易に棄却する(捨てる)べきではない。外れ値が生じた真の原因を突き止めてから!!


演習問題


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI