★ Fisherの正確確率検定について ★

2051. Fisherの正確確率検定について ふいっしゅ 2004/01/28 (水) 00:46
├2060. Re: Fisherの正確確率検定について uchan 2004/01/28 (水) 16:30
│└2064. Re^2: Fisherの正確確率検定について 青木繁伸 2004/01/28 (水) 18:56
├2054. Re: Fisherの正確確率検定について ひの 2004/01/28 (水) 02:14
└2052. Re: Fisherの正確確率検定について 青木繁伸 2004/01/28 (水) 01:00
 └2055. Re^2: Fisherの正確確率検定について ふいっしゅ 2004/01/28 (水) 02:27
  ├2059. Re^3: Fisherの正確確率検定について 青木繁伸 2004/01/28 (水) 10:57
  └2056. Re: Fisherの正確確率検定について ひの 2004/01/28 (水) 02:38
   └2057. Re^2: Fisherの正確確率検定について ふいっしゅ 2004/01/28 (水) 03:48
    └2058. Re: Fisherの正確確率検定について ひの 2004/01/28 (水) 03:57
     └2072. Re^2: Fisherの正確確率検定について ふぃっしゅ 2004/01/28 (水) 19:59


2051. Fisherの正確確率検定について ふいっしゅ  2004/01/28 (水) 00:46
こちらのページの"Fisher's exact test (extended)"を利用させて頂いているのですが,サイズの極めて大きな標本があって,計算が終わる前に接続が切れてしまいます。
何か対処の方法はありますでしょうか。
また,一般の統計ソフトでこの検定を行えるものはありますでしょうか。値が5以下のセルもあるので,カイ二乗検定を使うのは適切でないように思われます。

ご教示いただければ幸いです。
よろしくお願いします。

     [このページのトップへ]


2060. Re: Fisherの正確確率検定について uchan  2004/01/28 (水) 16:30
> こちらのページの"Fisher's exact test (extended)"を利用させて頂いているのですが,サイズの極めて大きな標本があって,計算が終わる前に接続が切れてしまいます。
> 何か対処の方法はありますでしょうか。

ダイヤルアップで接続しているためタイムアウトで切断されているのではないかと思います

使用しているネットワークのプロパティーのオプションで切断するまでの待ち時間を長くすればよいのではないかと思いますが,はずしてたらごめんなさい

     [このページのトップへ]


2064. Re^2: Fisherの正確確率検定について 青木繁伸  2004/01/28 (水) 18:56
> ダイヤルアップで接続しているためタイムアウトで切断されているのではないかと思います

タイムアウトには,いろいろな要因が加わりますが,プログラム自体も,計算時間が一定以上かかる場合には,異常終了させるようにしてあります。

ちなみに,オフラインで計算してみていますが,6時間ほど経過しても終わらないみたいです。(^_^;)

     [このページのトップへ]


2054. Re: Fisherの正確確率検定について ひの  2004/01/28 (水) 02:14
> こちらのページの"Fisher's exact test (extended)"を利用させて頂いているのですが,サイズの極めて大きな標本があって,計算が終わる前に接続が切れてしまいます。
> 何か対処の方法はありますでしょうか。

 Randomization test にすればよいのです。要するにFisherの正確確率検定のp値をモンテカルロ法で計算する方法です。niftyの会員なら以下の場所においてある私のプログラムが使えます(Windows用,10列×20行まで,データ数は3000までという制限あり)。

https://enter.nifty.com/iw/nifty/fsci/lib/1/504.html

>値が5以下のセルもあるので,カイ二乗検定を使うのは適切でないように思われます。

 セルの値は5以下でもかまいません。期待値が5以下のセルが20%未満であればカイ二乗検定は使ってよいはずです。

     [このページのトップへ]


2052. Re: Fisherの正確確率検定について 青木繁伸  2004/01/28 (水) 01:00
少し前の記事,#1959 参照

     [このページのトップへ]


2055. Re^2: Fisherの正確確率検定について ふいっしゅ  2004/01/28 (水) 02:27
ご回答ありがとうございます。
早速Rをダウンロードして試してみたのですが…

データは
第1行 2823  1444  553  363
第2行  638   185   51    1
第3行  108    79    5    2
というものです。
これをRで検定しようとしたところ,

Error in fisher.test(x) : Bug in FEXACT: gave negative key

というエラーが出てしまいます。
データに何かまずいところがあるのでしょうか。

     [このページのトップへ]


2059. Re^3: Fisherの正確確率検定について 青木繁伸  2004/01/28 (水) 10:57
> これをRで検定しようとしたところ,
>
> Error in fisher.test(x) : Bug in FEXACT: gave negative key
>
> というエラーが出てしまいます。
> データに何かまずいところがあるのでしょうか。

せっかく R をお使いいただけたのに,このような結果になって残念です。

残念ながら,この分割表における計算に必要なワークスペースがとれないようです。
この関数のもとになったと思われる 643.f というプログラム(statlib にあります)で,ワークスペースを限度いっぱいにしてもだめでした。

ひのさんがおっしゃるように,この分割表についてはカイ二乗分布による検定でよいでしょう。
検定手法を統一することは好ましいことだと思いますが,このような場合にはやむを得ないでしょう。
P 値が有意水準近辺ならば Fisher's exact test を行うのを積極的に勧めますが,明らかに有意な場合には無理に Fisher's exact test をする必要はないと思われます。

     [このページのトップへ]


2056. Re: Fisherの正確確率検定について ひの  2004/01/28 (水) 02:38
> データは
> 第1行 2823  1444  553  363
> 第2行  638   185   51    1
> 第3行  108    79    5    2

 期待値が5以下のセルはありませんから,カイ二乗検定で差し支えないと思います。

     [このページのトップへ]


2057. Re^2: Fisherの正確確率検定について ふいっしゅ  2004/01/28 (水) 03:48
お返事ありがとうございます。

> 期待値が5以下のセルはありませんから,カイ二乗検定で差し支えないと思います。

わかりにくかったかもしれませんが,データは

2823,1444,553,363
638,185,51,1
108,79,5,2

と5以下のセルが2つあります。
12セル中2セルなので,
このデータについてはカイ二乗でいいかもしれません。
ところがこの他のデータに0のセルが多いものがありまして,同じ検定法で検定して比較したいので,
Fisherの正確確率検定しかないかな,と思った次第です。
説明が足りなくてもうしわけありません。

     [このページのトップへ]


2058. Re: Fisherの正確確率検定について ひの  2004/01/28 (水) 03:57
> と5以下のセルが2つあります。
> 12セル中2セルなので,

 #2054に書きましたように各セルのデータの値は直接には問題ではないのです。「期待値」が5以下のセルの数が問題です。このデータでは期待値はすべてのセルで5より大きくなります。他の0を含むデータについても各セルの期待値をまず計算してみましょう。

     [このページのトップへ]


2072. Re^2: Fisherの正確確率検定について ふぃっしゅ  2004/01/28 (水) 19:59
青木さま,ひのさま,

ご回答ありがとうございました。
このデータに関してはカイ二乗検定で大丈夫でした。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る