No.09014 検定の使い分けについて  【上田】 2009/01/23(Fri) 23:57

はじめまして。
現在,卒業論文でRを使って有意差を求めています。

現在,困っているのは,t検定とu検定をどのように使い分ければいいかということです。

サンプル数が多いときはt検定,サンプル数が少ないときはu検定(ウィルコクソン)を使うという形でいいのでしょうか?それともks検定を使った方がいいのでしょうか?

ちなみにですが,サンプル数は13個と21個,7個と21個,7個と23個で比較しています。

No.09015 Re: 検定の使い分けについて  【上田】 2009/01/24(Sat) 00:14

すみません。質問事項について追加させてください。
今回は,各項目毎に平均値を算出しております。ただし,個別の値を見てみると,かなり値に差が見られ,平均値をとった状態では値が不正確になる可能性があります。
サンプル数は先ほどの質問をしたときと同じです。この場合でも,平均値の検定であるt検定を用いてよろしいのでしょうか?ちなみに,正規分布しているかはExcelで確認したのですが,おおざっぱに確認したので,あまり正確ではありません。

No.09016 Re: 検定の使い分けについて  【青木繁伸】 2009/01/24(Sat) 15:14

> Rを使って有意差を求めています

有意差は求めるものではありません。揚げ足を取っているのではなく,検定についてただしく理解しているかどうかが用語の使い方にあらわれるのです。注意しましょう。

> サンプル数が多いときはt検定,サンプル数が少ないときはu検定(ウィルコクソン)を使うという形でいいのでしょうか?

二つの検定は,サンプルサイズの多寡で決めるものではありません。
母分布が正規分布に従っていること,二群が等分散であるという2つの条件を満たしているときに,t検定(平均値の差の検定)が使えます。
(サンプル数というのはこの文脈ではサンプルサイズとした方がよいでしょう。u 検定という表記は慣例ではないですね。マン・ホイットニーの U 検定と記述するようにしましょう。少なくとも,U は大文字で。)

> ks検定を使った方がいいのでしょうか

ks 検定とは,この場合,二標本コルモゴロフ・スミルノフ検定の略でね?
二標本コルモゴロフ・スミルノフ検定は,位置の母数にも,分布の違い(散布度,非対称性など)にも反応するので,帰無仮説を棄却した後の判断が面倒です。

> 正規分布しているかはExcelで確認したのですが,おおざっぱに確認したので,あまり正確ではありません

サンプルサイズが小さい場合,正規性の検定は余り意味がありません。サンプルサイズが小さいために検出力が低くて,そのために正規性の帰無仮説が棄却できなかったに過ぎないという場合もありますから。

No.09017 Re: 検定の使い分けについて  【上田】 2009/01/24(Sat) 16:38

丁寧なご回答ありがとうございます。

サンプルサイズが小さいときに正規分布の比較を行っても,あまり意味がないということがわかりました。
ただ,今回の自分の研究の場合,結局どのようにして判断すればいいのかいまいちわかりません。今回の研究では,各プロットから平均値を算出して,それらから平均値や中央値を算出して有意差が生じるのか検定を行っております。
t検定に関しては,等分散であるかわからないので,ウェルチによって算出しました。
再び質問して申し訳ありませんが,よろしくお願いします。

No.09018 Re: 検定の使い分けについて  【青木繁伸】 2009/01/24(Sat) 21:19

> 今回の自分の研究の場合,結局どのようにして判断すればいいのかいまいちわかりません

先行研究を参考にするというのが,常套手段でしょうけど

> t検定に関しては,等分散であるかわからないので,ウェルチによって算出しました。

http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html も参考になるかも

No.09019 Re: 検定の使い分けについて  【上田】 2009/01/25(Sun) 00:31

質問へのご回答ありがとうございます。
以前に先輩に聞いたところ,正確な数は忘れたのですが,サンプルサイズが400と100ぐらいで検定をt検定でやったということでした(マン・ホイットニーのu検定もやったようでしたが,だいだい同じような結果になったということでした)。
一応,エクセルで簡単に分散を出してみたのですが,等分散なのか微妙な値になりました(VARという機能です。同じとみなしてもいいような気がしますが)だがら,たぶん等分散を仮定しないt検定で検討すればいいのかなと今は考えておりますがどうでしょうか?
何度もすみませんがよろしくお願いします。

No.09021 Re: 検定の使い分けについて  【青木繁伸】 2009/01/25(Sun) 09:49

> エクセルで簡単に分散を出してみたのですが,等分散なのか微妙な値になりました(VARという機能です。同じとみなしてもいいような気がしますが)

どうしてもエクセルでやりたいなら,分析ツールに「F検定:2標本を使った分散の検定」というのがありますから,それでちゃんと検定してください。まあ,バグがあるので注意が必要ですけど。

「F 検定: 2標本を使った分散の検定」
表示されている P 値は「P(F<=f) 両側」と書かれていますが,それは真っ赤な嘘です。表示されるのは,片側 P 値です。両側 P 値は,表示されている値を 2 倍しないといけません。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc006/400.html

No.09025 Re: 検定の使い分けについて  【上田】 2009/01/25(Sun) 19:53

ご回答ありがとうございます。
エクセルで試してみたいと思います。

何度も質問して申し訳ありませんでした。今までありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る