No.05619 外れ値検定後に残ったデータが従う分布について  【島本水無瀬】 2008/01/31(Thu) 00:37

http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs.html
スミノルフ・グラブス検定について教えてください。
上記の例では,20個のデータのうち,164が有意水準5%で捨てられていますが,残った値の分布について教えていただきたいのです
164 は,母集団の正規分布(140,8^2)で標準化すると,z=3です。この時点で,有意水準5%だと棄却されると思いますが,あえて,標本平均 141.7,不偏分散55で外れ値検定をしたということは,この標本分布に164が存在しても珍しくないかを検定したかということでしょうか。また,残っ た19データについて,平均140,標準偏差8の分布にしたがっていると考えるのでしょうか,それとも平均141.7標準偏差55^0.5の分布にした がっていると考えるのでしょうか。

No.05621 Re: 外れ値検定後に残ったデータが従う分布について  【青木繁伸】 2008/01/31(Thu) 13:38

> 164は,母集団の正規分布(140,8^2)で標準化すると,z=3です。この時点で,有意水準5%だと棄却される

そういう棄却検定はありません。個々のデータが何シグマはずれようが検定とは何の関係もありません。

> あえて,標本平均141.7,不偏分散55で外れ値検定をしたということは,

あえて検定したのではなく,この方法が外れ値の検定としてふさわしいものだからこの方法を採ったのでしょう

> この標本分布に164が存在しても珍しくないかを検定したかということでしょうか

帰無仮説と対立仮説から言えば,そういうことですね

> 残った19データについて,平均140,標準偏差8の分布にしたがっていると考えるのでしょうか,それとも平均141.7標準偏差55^0.5の分布にしたがっていると考えるのでしょうか

考え方の違いでしょう。
「母 集団はN(140, 8^2)」と宣言しているので,そこからとった標本はそれに従っているのでしょう。全20個のデータもソウだし,そこから外れ値の可能性が高いものを除い た19個のデータもソウだし。外れ値だって,その母集団に含まれているものかも知れない。それは,データの数値だけを見ただけではわからないが。

一 方,残った19個のデータに基づいて,このデータは「母集団はN(140, 8^2)」ではなく「N(141.7, 55)」に従うと「推定される」とも言える。どちらからの標本であるかは尤度比検定などをやると良いのかも知れないが,ほんのわずかの違いだからどっちで も大差ない。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る