No.04306 カイ2乗検定か?t検定か?  【かい・てぃー】 2007/09/03(Mon) 18:03

統計学の教科書で調べてみたのですが,わからないことがあり,こちらで質問させていただくことにしました。
タイトルの通り,カイ2乗検定を行えばよいのか,t検定を行えばよいのかわからずに困っています。
教えていただけると幸いです。(数値は仮設例です)

集中力を妨害する作用のあるクスリの効果を確かめる実験を,5人の被験者に対して行いました。
各人,正常な状態とクスリを飲んだ状態で,それぞれ20回ずつ課題をこなしてもらいます。

       正常      クスリ
     成功  失敗   成功 失敗
被験者A 18   2    4 16
被験者B 20   0    4 16
被験者C 19   1   19  1
被験者D 17   3    2 18
被験者E 16   4   11  9
--------------------------------------
合計   90  10   40 60
平均    9   1    4  6

このようなデータが仮にあったとして,「クスリを服用すると有意に課題の成功率が下がる」という仮説を検証したいとします。

1)成功率をそれぞれ求め,「対応のあるt検定」を行うとP=0.0346という結果になりました。(あるいは成功回数そのもので対応のあるt検定を行っても結果は同じ。)

2) 正常状態での成功回数(18,20,19,17,16)を期待度数として,クスリ服用での成功回数(4,4,19,2,11)を観測度数として,カイ2乗 検定を行ったところ,P=1.67284E-57 という結果になりました。(この場合の自由度は(2-1)×(5-1)=5で正しいでしょうか?)
(「クスリには効果が無い」が帰無仮説だとすると,「正常状態での成功回数が期待される成功回数になる」…と考えました)

3) しかし,2)の方法は"失敗回数が考慮されていない"(=割合ではない)ので,おかしいのではないかと思い,正常状態での成功回数,失敗回数 (90,10)を期待度数とし,クスリ服用での成功回数,失敗回数(40,60)を観測度数として,カイ2乗検定を行ったところ,P=1.85994E- 24 という結果になりました。(この場合の自由度は(2-1)×(2-1)=1で正しいでしょうか?)
しかし,これを割合(0.9,0.1),(0.4,0.6)にすると,P=0.307434453(有意でない!)となってしまいます。

4)しかしながら,全員のデータを単に足し合わせて,期待度数とするのはおかしいのではないかと思い,上記データを被験者数=5で割って,(18,2)を期待度数,(8,12)を観測度数としたところ,P=5.01033E-06 という結果になりました。

5) さらに気になることがあって,各人の 正常状態での正答率(0.9,1,0.95,0.85,0.8)を期待度数(?)各人のクスリ服用での正答率 (0.2,0.2,0.95,0.1,0.55)を観測度数(?)としてカイ2乗検定を行ったところ,P=0.0225となりました。

多くのケースで帰無仮説は棄却されるわけですが,どの方法が正しいのか私には判断がつかず困っています。

疑問をまとめますと,
※1)上記のどの方法が正しいですか?あるいはどれも間違っていますか?
※2)カイ2乗検定で,割合を期待度数(何せ度数なので)に持ってくるのは間違いなのでしょうか?

ということになります。

長々と書いてしまいましたが,具体例のほうが読んでいただく際にもわかりやすいのではないかと思い,このように書き込みさせていただきました。
ご教授よろしくお願いいたします。

参考文献
佐藤信「推計学のすすめ」ブルーバックス
山内光哉「心理・教育のための統計法(第2版)」サイエンス

No.04307 Re: カイ2乗検定か?t検定か?  【青木繁伸】 2007/09/03(Mon) 18:35

たくさんあって回答しにくいのですが

> 2)正常状態での成功回数(18,20,19,17,16)を期待度数として,クスリ服用での成功回数(4,4,19,2,11)を観測度数として,カイ2乗検定を行ったところ

これは不適切です
そもそも,ちゃんとした検定においては,期待度数の合計と観測度数の合計は同じになります。この条件を満たさないだけでも,このやり方は間違っていることが明白です。

> 3)正常状態での成功回数,失敗回数 (90,10)を期待度数とし

一人あたり20回の(薬の種類で言えば10回ずつ)データは独立でないのでプールするのはまずいでしょう。

> この場合の自由度は(2-1)×(2-1)=1で正しいでしょうか?

カテゴリー数2の適合度の検定ですから計算式は (2-1) = 1 でしょう
しかし,方法に問題があるので論外

> これを割合(0.9,0.1),(0.4,0.6)にすると

この数値でカイ二乗検定(適合度の検定)をやったのですか?
セルの数値は,計数値(整数)であることを再確認しましょう。

> 4)上記データを被験者数=5で割って,(18,2)を期待度数,(8,12)を観測度数

データ数が 1/5 になりますね。データ数が変わるのは不吉な兆候。誤った方法でしょう。

> 5)さらに気になることがあって,各人の 正常状態での正答(0.9,1,0.95,0.85,0.8)を期待度数(?)

自分でも変に思っているようですが,3)の最後の指摘と同じです。小数付きの数値で形式的に計算してもそれは間違いです。

1) は比較的まともでしょう。正答率という値を測定値と見るのはまずは妥当でしょう。

しかし,被検者ごとに回答数が異なるような場合にはまずいでしょうね。
検定のやり方というよりデータを採る際の問題ですが,2種類の薬で10回ずつという測定が,適切かどうか疑問です。慣れとかどちらの薬を先にやるかとか,測定の時間間隔とか。

検定方法が見つからないような実験計画を立てると,どうしようもなくなります。

No.04308 Re: カイ2乗検定か?t検定か?  【青木繁伸】 2007/09/03(Mon) 18:45

じゃあ,どうやったらよいかというと

ある一人の被験者には2つの薬それぞれで1回ずつ測定(どちらの薬を先にするかはランダムに割り振る)
被検者はなるべく多くとる(5人×20回×2薬で計200回やれるなら,理論的に言えば1回×2薬なら100人からデータがとれるよね)
で,マクネマーの検定を行う。

No.04309 Re: カイ2乗検定か?t検定か?  【かい・てぃー】 2007/09/03(Mon) 19:17

このような煩雑な質問に,ご丁寧な説明をしていただき
非常にうれしく思います。勉強になりましたm(_ _)m

カイ2乗検定の使い方そのものがおかしかったのだなと
気づきました。すみません…

>1) は比較的まともでしょう。正答率という値を測定値と見るのはまずは妥当でしょう。

にはげまされました。

まずマクネマーの検定を勉強しようと思います!
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る