No.00697 2×2のカイ自乗検定の適用範囲  【ミサ】 2006/07/22(Sat) 21:05

カイ自乗検定について判らない点があり,質問させて頂きます。

【A,B2群間である指標Cの出現頻度に有意差があるか否か?】

上記の場合,カイ自乗検定は可能でしょうか?

頻度の比較検定からノンパラだとは思うのですが,上記の場合ですと2×2(行=A,B,列=指標Cの”あり””なし”)の各セルの期待度数を前以って知ることが不可能ではないかと思い,質問させて頂きました。

此処からは引用ですが,あるテキストに,
”6才児203名にある知能検査の小問をやらせた。合格者(1と符号化する)と,不合格者(0と符号化する)とを男女別に整理したところ,
男児:合格者18,不合格者84/女児:合格者8,不合格者93
となった。合格率(通過率)に差があるか。”
といった例題があり,カイ自乗検定を適応していました。

この場合も,合格者と不合格者は独立な関係ではなく,その点で上記の
【A,B2群間である指標Cの出現頻度に有意差があるか否か?】
と同様の性質をもっているものと思います。

長くなりましたが,前以って期待度数が算出出来ない場合でもカイ自乗検定は適用可能なのでしょうか?

ご教授,お願い致します。

No.00698 Re: 2×2のカイ自乗検定の適用範囲  【青木繁伸】 2006/07/22(Sat) 21:10

この場合の帰無仮説はどのようになるとお思いでしょうか。
また,その帰無仮説が正しいとしたとき,A, B 群での期待値(期待される合格者数)は幾つになるでしょうか?
その次に,期待値からの乖離を表す指標としてはどのようなものが考えられるのでしょうか。
最後に,それら乖離の指標を合計したものはどのようなものになるのでしょうか?

2×2分割表の場合の独立性の検定の開設をお読みになりましたか?

No.00699 Re: 2×2のカイ自乗検定の適用範囲  【青木繁伸】 2006/07/22(Sat) 21:13

補足

この問題は二群の比率の差の検定としてもとらえられますが,独立性の検定との対比はわかりますか?

No.00701 Re: 2×2のカイ自乗検定の適用範囲  【ミサ】 2006/07/22(Sat) 21:32

迅速なお返事,ありがとうございます。

まず,帰無仮説ですが
『A,B群(男児,女児)間で合格率に差は無い』
となると思います。

ここで,私が疑問に思いましたのはご指摘頂いた通り,合格者数の期待度数を前もって算出することは不可能ではないか?という点です。

期待値からの乖離の指標も,申し訳ありません。勉強不足です。
『2×2分割表の場合の独立性の検定の開設』を読ませて頂きます。

テキストには比率の差の検定とカイ自乗検定が取り上げられていました。

あっ!!周辺度数は例題でも【A,B2群間である指標Cの出現頻度に有意差があるか否か?】でも観測度数から算出することは可能ですよね。とすると,周辺度数から各セルの期待度数を算出可能と…今思いつきましたが,再度調べてみます。

ご指摘・ご教授,ありがとうございました。

No.00703 Re: 2×2のカイ自乗検定の適用範囲  【ミサ】 2006/07/22(Sat) 21:59

度々申し訳ありません。
独立性の検定と比率の差の検定について読ませて頂きました。

テキストにありました
”6才児203名にある知能検査の小問をやらせた。合格者(1と符号化する)と,不合格者(0と符号化する)とを男女別に整理したところ,
男児:合格者18,不合格者84/女児:合格者8,不合格者93
となった。合格率(通過率)に差があるか。”
は,二群間の比率の検定だと思いました。

先生のサイトでは上記の様な場合,カイ自乗検定ではなく比率の差の検定を用いることとありましたが,それではテキストにあるカイ自乗検定の適用は誤用なのでしょうか?

ご教授頂けますと幸いです。

No.00704 Re: 2×2のカイ自乗検定の適用範囲  【青木繁伸】 2006/07/22(Sat) 22:07

比率の差の検定と独立性の検定の両方のページを読めば,両者が同じP値を与える(片方はZ統計量,もう一方はカイ二乗統計量を与えるという違いはあるのだが)と書いてありませんでしたっけ。

No.00705 Re: 2×2のカイ自乗検定の適用範囲  【青木繁伸】 2006/07/22(Sat) 22:16

まだるっこしいので解答を

> 男児:合格者18,不合格者84/女児:合格者8,不合格者93

帰無仮説が,男女で合格率が同じということなのだから,それが正しいとすれば,男女を一緒にしたときの合格率の推定値は(18+8)/(18+84+8+93)=0.1280788
男 児の期待合格者数は0.1280788*(18+84)=13.06404,女児では0.1280788*(8+93)=12.93596不合格者数の期 待値はわかりますよね。男児女児の合格・不合格の組み合わせ4通りについて,(観察値-期待値)^2/期待値を計算し,合計したものがカイ二乗値(自由度 1)
上のような計算をしなくても,4つの桝目と合計値欄の数値を代入してカイ二乗値を求める計算式もありますね。
比率の差の検定は公式に代入すればZ得点が得られる。
実際に計算してみてください。
p値を求めるのにはたとえばExcelを使ってでもできます。
それができない場合には,求めたZ得点を二乗した値が,カイ二乗値に一致する(途中の計算の精度が低いと小数点以下何桁目かで違ってくるでしょうが,電卓などを使ってできるだけ正確に計算すると,ほとんど一致するでしょう)。

No.00707 Re: 2×2のカイ自乗検定の適用範囲  【ミサ】 2006/07/22(Sat) 23:35

ありがとうございます!!

期待度数を後から求める場合もカイ自乗検定を適用出来るのですね。
調査前後はともかく周辺度数が判ればそこから期待度数を算出でき,期待度数と観測度数との乖離の程度によって,有意差があるか否かを検定できるわけですね!!

テキスト上ではカイ自乗を行なっていましたが,期待度数が5以下のセルがあったため直接確率法を用いていました。

P値について,独立性の検定と比率の差の検定で得られる指標がZ値かカイ自乗量か…
すごくためになりました。

手元にあるデータを実際に分析しようと思います。

本当にありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る