No.07479 χ2乗検定と残差分析について  【ぺんた】 2008/08/26(Tue) 22:52

お世話になります。

2グループ×5件法のχ2乗検定について幾つか質問させてください。とりあえず過去ログは拝見させていただいていますが,よくわかりませんでしたので,自分のデータで質問させていただきたいと思います。

質問「あなたはコーヒーが好きですか」
実数の欄が右へ行くほど「好意的」反応:左から「まったくあてはまらない」「どちらかというとあてはまらない」「普通」「どちらかというとあてはまる」「とてもあてはまる」

A Group 実数 23 11 8 6 9
B Group 実数 8 11 15 25 4

以下,質問です。

Q1 (χ2乗検定は有意です)残差分析をせずに,「Bグループの方がAグループよりコーヒーが好き」と結論づけてはだめなのでしょうか?

Q2 各セルの期待度数が均等にならないのはなぜですか?

Q3  素人感覚では,例えばB Groupの実数が 8と11ですので,B Groupは「どちらかというと当てはまる」により多く集まっていると感じるのですが,それぞれの調整済み残差の値が-3.5と-0.3ですので,「まっ たくあてはまらない」に(期待度数より)多く集まっている,つまりこのセルが全体の偏りに影響を与えているとなるのですよね?何となく違和感があります が....。どのように解釈すべきなのでしょうか?

よろしくお願いいたします。


No.07480 Re: χ2乗検定と残差分析について  【青木繁伸】 2008/08/26(Tue) 23:15

> Q1 (χ2乗検定は有意です)残差分析をせずに,「Bグループの方がAグループよりコーヒーが好き」と結論づけてはだめなのでしょうか?

どこに違いがあるかを知る必要がなければ,残差分析をする必要はないでしょう。
また,今回のデータにおいては,データは順序尺度変数なので,カテゴリーに順序があることを無視するカイ二乗検定というのは適切なものではないでしょう。最適なものはマン・ホイットニーのU検定ですね。それを採用すれば,残差分析というオプションは消失します。

> Q2 各セルの期待度数が均等にならないのはなぜですか

均等というのはどういうことですか?

> Q3 素人感覚では,例えばB Groupの実数が 8と11ですので,B Groupは「どちらかというと当てはまる」により多く集まっていると感じるのですが,それぞれの調整済み残差の値が-3.5と-0.3ですので,「まっ たくあてはまらない」に(期待度数より)多く集まっている,つまりこのセルが全体の偏りに影響を与えているとなるのですよね?何となく違和感がありますが

期待値と観察値の差,(観察値−期待値)^2/期待値 などと観察値を比較してみてください。あなたの感じる違和感というのが分からないですね。

No.07482 Re: χ2乗検定と残差分析について  【ぺんた】 2008/08/27(Wed) 00:21

青木先生

早速回答いただきありがとうございます。

1つ質問させてください。我々の分野ではよく順序尺度変数のχ2乗検定があるのですが,青木先生のコメントからしてこれは誤用ということでよろしいでしょうか?

「均等」という意味は,例えばA Groupが50人の被験者なら,単純に50÷5カテゴリー数の10がそれぞれのセルに割り振られた期待度数だとおもっていたのですが。

そ れから,推奨されている手法を用いて分析した場合,「どちらが大きい(小さい)」ということをいうために,実データの平均値を持ち出してもよろしいでしょ うか?エクセル統計の結果には,サンプル数,平均順位,U1-U2の値(および検定結果)が計算されますが,5件法で行っていますので,平均値を出した方 がわかりやすいかとも考えています。

よろしく御願いします。

No.07485 Re: χ2乗検定と残差分析について  【青木繁伸】 2008/08/27(Wed) 10:04

> 我々の分野ではよく順序尺度変数のχ2乗検定があるのですが,青木先生のコメントからしてこれは誤用ということでよろしいでしょうか?

誤用と言うほどではないけど,適切な検定を採用しているとは言えない。検出力が低いので,知らないうちにみすみす帰無仮説を採択しているかも知れない。

> 「均等」という意味は,例えばA Groupが50人の被験者なら,単純に50÷5カテゴリー数の10がそれぞれのセルに割り振られた期待度数だとおもっていたのですが

思い違いですね。統計ソフトの出力を見るのじゃなくて自分で期待値を計算してみてください。なぜ違うかがわかります。この場合の期待値は,あなたが思うような方法で計算されていません。

> 「どちらが大きい(小さい)」ということをいうために,実データの平均値を持ち出してもよろしいでしょうか?

まずいでしょうね。(まあ,そっと出して,査読者が文句を言わなければ,シメシメということでも良いかもしれない)

同順位を厳密に解釈する中央値を出すのがよい。
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/median.html
の,one more step 以降を参照。

> エクセル統計の結果には,サンプル数,平均順位,U1-U2の値(および検定結果)が計算されます

ということならば,平均順位を出すのもよいでしょうね。

No.07486 Re: χ2乗検定と残差分析について  【ぺんた】 2008/08/27(Wed) 11:58

青木先生

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る