No.08903 Fisher's exact test(extended)の適用について  【いしやま】 2009/01/13(Tue) 14:29

初めて投稿させていただきます。お忙しいところ恐れ入りますが,ご教示どうぞ宜しくお願いいたします。

現在,3859という大きなデータをクロス集計し,有意差をみようとカイ二乗検定をしました。しかし,「このデータの場合,度数が0というセルがあるので,適用に問題があるのではないか」という指摘を受けています。具体的データは次の2つです。

<データ1>
第1行 729, 616, 16, 317, 452, 774, 328
第2行 74, 130, 0, 164, 96,60,41
第3行 1, 0, 56, 3, 0, 1, 1
<データ2>
第1行 283, 315, 34, 110, 270, 630, 210
第2行 243, 79, 15, 80, 78, 125,35
第3行 256, 281, 23, 127, 106, 78, 118
第4行 22, 71, 0, 167, 94, 2, 7

<データ1>の場合(Pearsonのカイ二乗 =2907.267, df=12, p<.001, 1セル(4.8%)は期待度数が5未満,最小期待度数は1.16)
<データ2>の場合(Pearsonのカイ二乗 =1009.424, df=18, p<.001, 0セル(.0%)は期待度数が5未満,最小期待度数は6.77)

こ れらの場合,(1)カイ二乗検定が不適用であるなら,Fisher's exact test(extended)をするとよいのでしょうか?(試しに,こちらのページのFisher's exact test(extended)を利用させていただきましたが,カイ二乗の値は出るものの,その後,計算中のまま(8時間以上)の状況です。このまま待って いると計算は終了するのでしょうか?)
(2)もし,Fisher's exact test(extended)がよいということであれば,対処の仕方,あるいは,他の方法等ご教示ください。(以前の投稿で「2054」の回答に Randomization test についての情報も拝見いたしましたが,データ数は3000までという制限があるということでしたので,この場合は使用不可と思われます。)

お忙しいところお時間を頂きたいへん恐縮ですが,ご回答の程お待ち申し上げております。

No.08905 Re: Fisher's exact test(extended)の適用について  【ひの】 2009/01/13(Tue) 15:09


>(以前の投稿で「2054」の回答にRandomization test についての情報も拝見いたしましたが,データ数は3000までという制限があるということでしたので,この場合は使用不可と思われます。)

  それは私の作ったソフトにたまたまそのような機能制限があったというだけで,Randomization test という方法自体にはそのような制限はありません。ですからしかるべきプログラムを書けば適用可能です。なお引用された箇所にあるURLはすでに無効になっ ています。
 管理人様からプログラムをバージョンアップするようずいぶん前に依頼を受けていますが,いまだにサボっております。申し訳ない(^^;)。ていうかプログラミングから遠ざかって久しい。

No.08906 Re: Fisher's exact test(extended)の適用について  【いしやま】 2009/01/13(Tue) 15:36

ひのさま
早速の投稿,誠にありがとうございます。Randomization testについて,現状を了解いたしました。(お忙しいとは思いますが,是非この機会に私個人のみならず統計学界全体のためにも「プログラムのバージョン アップ」をしていただけたらよいのですが…図々しい発言で申し訳ございません(~_~;))また,このケースの場合,現在これに (Randomization test)代わるソフトおよび手法等ありましたら,是非ご教示いただければ幸いです。どうぞ宜しくお願いいたします。

No.08908 Re: Fisher's exact test(extended)の適用について  【青木繁伸】 2009/01/13(Tue) 16:05

> こちらのページのFisher's exact test(extended)を利用させていただきましたが,カイ二乗の値は出るものの,その後,計算中のまま(8時間以上)の状況です。このまま待っていると計算は終了するのでしょうか?

終了しないでしょう。というか,既に,アボートされていると思います。
R でも(その他 SPSS や SAS など,StatExact からライセンス提供されているプログラムパッケージでも)計算不能でしょう。

ところで,今までのスレッドを少し読めば(質問する前にはそうすべき),No. 8844 からのスレッドに目を留めたかもしれないのに,残念。No. 8845 に,重要な事柄が書いてある。

カイ二乗検定を適用するときに問題となる状況についてです。
> <データ1>の場合(Pearsonのカイ二乗 =2907.267, df=12, p<.001, 1セル(4.8%)は期待度数が5未満,最小期待度数は1.16)
> <データ2>の場合(Pearsonのカイ二乗 =1009.424, df=18, p<.001, 0セル(.0%)は期待度数が5未満,最小期待度数は6.77)
というのを,どう評価するべきか,そこに答えが書いてありますよ。

> 度数が0というセルがあるので,適用に問題があるのではないか

というのは,真っ赤な大嘘です。

No.08910 Re: Fisher's exact test(extended)の適用について  【いしやま】 2009/01/13(Tue) 17:36

青木繁伸先生
お忙しいところ,重要なご指摘ありがとうございます。また,「No. 8844 からのスレッド」を見逃していましたこと,お詫びいたします。

と ころで確認させていただきたいのですが,(1)今回の場合,2データとも一応,カイ二乗検定が適用可能であるということ,(2)ただ,<データ 1>の場合,最小期待度数は1.16でしたのでFisher's exact test(extended)をすればより望ましいが,現実に一般的に計算してくれるソフトがない,(3)したがって,<データ1>の場合 は,結果の解釈について多少なりとも検討を要する,ということでよろしいのでしょうか。

たびたび,お時間を頂き恐縮ですが,どうぞ宜しくお願いいたします。

No.08912 Re: Fisher's exact test(extended)の適用について  【青木繁伸】 2009/01/13(Tue) 18:04

> (2)ただ,<データ1>の場合,最小期待度数は1.16でしたのでFisher's exact test(extended)をすればより望ましいが,現実に一般的に計算してくれるソフトがない,(3)したがって,<データ1>の場合 は,結果の解釈について多少なりとも検討を要する

データ1の場合も,ギリギリのところで,適用しても問題はないということでよいと思います。

な お,もし列が群と見なせて,列方向(上から下へ)のカテゴリーに順序があるようなら,つまりデータ1だと7群3カテゴリーのような場合だと,カイ二乗検定 は不適切でクラスカル・ウォリス検定を適用すれば,問題点は全て解決と言うことになりますが,そういう条件ではないということなのでしょうね。

No.08915 Re: Fisher's exact test(extended)の適用について  【いしやま】 2009/01/14(Wed) 10:52

青木繁伸先生
早速のご返信,誠にありがとうございます。今回のケースはご指摘のような条件ではありませ ん。したがって,カイ二乗検定を適用させることにしたいと思います。お蔭様で問題解決しましたこと,ご報告させて頂きます。最後に初心者である私に丁寧な ご指導をいただきましたこと心より感謝いたします。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る