★ 異常値の有無の検定(初心者です) ★

 108 異常値の有無の検定(初心者です)  とみざわ  2001/03/16 (金) 20:19
  109 Re: 異常値の有無の検定(初心者です)  中原  2001/03/16 (金) 21:54
   132 Re^2: 異常値の有無の検定(初心者です)  とみざわ  2001/03/26 (月) 17:43
    136 Re^3: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/26 (月) 20:46
     147 Re^4: 異常値の有無の検定(初心者です)  とみざわ  2001/03/27 (火) 16:34
      150 Re^5: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 19:14
       157 Re^6: 異常値の有無の検定(初心者です)  とみざわ  2001/03/28 (水) 12:01
        158 Re^7: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/28 (水) 12:32
       152 Re^6: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 22:03
        153 Re^7: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 23:00
     137 Re^4: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/26 (月) 20:46


108. 異常値の有無の検定(初心者です)  とみざわ  2001/03/16 (金) 20:19
1.正規分布に従うと思われるデータについて,異常値の有無を検定し,それを棄却する方法を教えてください。
Grubbs法,Cochran法,Dixon法等は使えるのでしょうか?
それとも違う検定方法はありますか?

2.また対数正規分布に従うと思われるデータについても,1と同様に教えてください。

     [このページのトップへ]


109. Re: 異常値の有無の検定(初心者です)  中原  2001/03/16 (金) 21:54
> 1.正規分布に従うと思われるデータについて,異常値の有無を検定し,それを棄却する方法を教えてください。
> Grubbs法,Cochran法,Dixon法等は使えるのでしょうか?
> それとも違う検定方法はありますか?

それらの検定が使えないのではないか?と思ったわけですか?その理由は?
ほかに,トンプソン検定とか言うのもあるかもしれませんね。

> 2.また対数正規分布に従うと思われるデータについても,1と同様に教えてください。

測定値の対数をとって,その後上記の検定を行えばいいのではないでしょうか。

     [このページのトップへ]


132. Re^2: 異常値の有無の検定(初心者です)  とみざわ  2001/03/26 (月) 17:43
> > 1.正規分布に従うと思われるデータについて,異常値の有無を検定し,それを棄却する方法を教えてください。
> > Grubbs法,Cochran法,Dixon法等は使えるのでしょうか?
> > それとも違う検定方法はありますか?
>
> それらの検定が使えないのではないか?と思ったわけですか?その理由は?
> ほかに,トンプソン検定とか言うのもあるかもしれませんね。

そもそもこれらの検定方法を使用してよいのかが分かりません。またN数が400以上あるのですが,このような大きなN数のときの棄却限界値がどの本を見ても載ってないのでわかりません。もし分かりましたら教えて頂きたいです。
トンプソン検定については全く知りませんので,教えてください。

>
> > 2.また対数正規分布に従うと思われるデータについても,1と同様に教えてください。
>
> 測定値の対数をとって,その後上記の検定を行えばいいのではないでしょうか。

対数をとるというのは,底が10でしょうか?それともeなのでしょうか?

     [このページのトップへ]


136. Re^3: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/26 (月) 20:46
> そもそもこれらの検定方法を使用してよいのかが分かりません。またN数が400以上あるのですが,このような大きなN数のときの棄却限界値がどの本を見ても載ってないのでわかりません。もし分かりましたら教えて頂きたいです。

検定方法の使用の可否については,使用者が判定すべきですね(^_^;)

Grubs 検定の有意点については,N が大きいときには近似式があります。
http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs-table.html
400くらいにもなれば,近似の程度もいいのではないかとは思いますが,その精度についての記述は見たことがありません。有意点の正確な計算法もどこかに記載があるかもしれないですね(インターネット上とは限らない)。

> トンプソン検定については全く知りませんので,教えてください。

参考書の紹介は,過去ログにあります。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc011/231.html
トンプソン検定統計量はnが大きくなると 1.94 あたりに収束するように見えますね。

ほかの統計量もnが大きくなると一定の値に近づくと思いますよ。だからこそ,nが大きいときの有意点が示されないのではないかと推測しますがどうでしょう。

つづく

     [このページのトップへ]


147. Re^4: 異常値の有無の検定(初心者です)  とみざわ  2001/03/27 (火) 16:34
>
> Grubs 検定の有意点については,N が大きいときには近似式があります。
> http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs-table.html

上記のページ見ました。
近似式が載っていたのですが,tα/nが良く分かりません。
教えていただけませんでしょうか?

     [このページのトップへ]


150. Re^5: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 19:14
> 近似式が載っていたのですが,tα/nが良く分かりません。

たとえば,
n = 20, α=0.025 のとき,
α/n = 0.025/20 = 0.00125
自由度 n-2=18 のt分布の,上側 0.00125 パーセント点は 3.510067472 です。これを t α/n と表しているのです。
式を書く都合上,t α/n を X とおきます。
有意点の近似値は,
(n-1)*SQRT(X^2/(n*(n-2)+n*X^2))=2.708228855
となります。

     [このページのトップへ]


157. Re^6: 異常値の有無の検定(初心者です)  とみざわ  2001/03/28 (水) 12:01
> > 近似式が載っていたのですが,tα/nが良く分かりません。
>
> たとえば,
> n = 20, α=0.025 のとき,
> α/n = 0.025/20 = 0.00125
> 自由度 n-2=18 のt分布の,上側 0.00125 パーセント点は 3.510067472 です。これを t α/n と表しているのです。
> 式を書く都合上,t α/n を X とおきます。
> 有意点の近似値は,
> (n-1)*SQRT(X^2/(n*(n-2)+n*X^2))=2.708228855
> となります。

詳しい説明いつもありがとうございます。
またそこで質問です。上側0.00125パーセント点は3.510067472であるというなのですが,ExcelのTNIV関数を使うと(使っていいのでしょうか?)0.0025(0.00125の2倍?)パーセントでこの値になりました。
そこでは必ず2倍して求めるのでしょうか?
それともここは片側とか両側といわれるところに関係する部分なのですか?

     [このページのトップへ]


158. Re^7: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/28 (水) 12:32
> またそこで質問です。上側0.00125パーセント点は3.510067472であるというなのですが,ExcelのTNIV関数を使うと(使っていいのでしょうか?)0.0025(0.00125の2倍?)パーセントでこの値になりました。
> そこでは必ず2倍して求めるのでしょうか?
> それともここは片側とか両側といわれるところに関係する部分なのですか?

そうです。
Excel の tinv は,両側確率に対するパーセント点を返すのです。
ですから,上側確率が0.05のパーセント点を求めるときには,tinv(2*0.05,自由度)としないといけないんですね。

     [このページのトップへ]


152. Re^6: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 22:03
Excel で計算しようとするとn = 183 以降で計算不能になります。
awk だと,そうでもないのかな?
明日,くわしく吟味します。
BEGIN {
    al[0] = 0.1
    al[1] = 0.05
    al[2] = 0.025
    al[3] = 0.01

    for (n = 3; n <= 30; n++) {
        printf "%5i ", n
        for (i = 0; i < 4; i++) {
            x = pxt(2*al[i]/n, n-2)^2
            printf "%10.3f", (n-1)*sqrt(x/(n*(n-2)+n*x))
        }
        print ""
    }
}
pxt は,
http://aoki2.si.gunma-u.ac.jp/Hanasi/Algo/pxt.html
さらに,
http://aoki2.si.gunma-u.ac.jp/Hanasi/Algo/txp.html
http://aoki2.si.gunma-u.ac.jp/Hanasi/Algo/pxg.html
が,必要ですが。

     [このページのトップへ]


153. Re^7: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/27 (火) 23:00
変数の宣言で long とすべきところを integer にしていたためでした(^_^;)

Excel で計算したいときには,以下のところからダウンロードしてください

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/sg.xls

sg 関数は Excel の tinv 関数を使っているので,ちょっと変なところがあります(n=12,α=0.1 のところ。何でだろ)

sg2 関数の方を使ってください(って,あってるだろうか。(^_^;)

     [このページのトップへ]


137. Re^4: 異常値の有無の検定(初心者です)  青木繁伸  2001/03/26 (月) 20:46

> 対数をとるというのは,底が10でしょうか?それともeなのでしょうか?

log n X = log m X/ log m n の関係式があるので,底が何であっても,倍数がかかるだけです。だから,底は何でもいいです。コンピュータで計算するときには自然対数がよいでしょう。昔は常用対数が使われていましたが,それは「対数表」などというものを使って計算していたからでもあります。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 013 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る