★ 標本数が少ないときの適合度検定について ★

7527. 標本数が少ないときの適合度検定について メンデル 2005/08/27 (土) 13:51
└7528. Re: 標本数が少ないときの適合度検定について 青木繁伸 2005/08/27 (土) 14:30
 └7530. Re^2: 標本数が少ないときの適合度検定について メンデル 2005/08/27 (土) 15:17
  └7531. Re^3: 標本数が少ないときの適合度検定について 青木繁伸 2005/08/27 (土) 17:27
   └7534. Re^4: 標本数が少ないときの適合度検定について メンデル 2005/08/27 (土) 21:09


7527. 標本数が少ないときの適合度検定について メンデル  2005/08/27 (土) 13:51
常染色体優性形質の発症について適合度検定を行いたいと思っています。aaXAaの交配からの分離比の検定です。標本数は10例 です。この程度の数の場合,カイ二乗検定を用いて良いのでしょうか? 二項検定を用いたほうが良いのでしょうか? あるいは別の適合度検定を用いるべきな のでしょうか。アドバイスをよろしくお願いします。

     [このページのトップへ]


7528. Re: 標本数が少ないときの適合度検定について 青木繁伸  2005/08/27 (土) 14:30
> 常染色体優性形質の発症について適合度検定を行いたいと思っています。aaXAaの交配からの分離比の検定です。標本数は10例です。この程度の数の場 合,カイ二乗検定を用いて良いのでしょうか? 二項検定を用いたほうが良いのでしょうか? あるいは別の適合度検定を用いるべきなのでしょうか。アドバイ スをよろしくお願いします。

二項検定かというお問い合わせなので,カテゴリーは2つなんですね。
「aaXAa」というのが aa と Aa を掛け合わせるというのがぱっと理解できない人も多いと思いますが。それが aa と Aa に分離するというのは,生物学を取っていた人でも忘れてしまっているかも。

とりあえず。

二項検定は Exact な検定です。
注:Excact ではあるが,それをカイ二乗近似(正規近似)してはいけない。

なお細かいことですが,「標本数」とあるのは,日本語で言うなら「標本の大きさ」カタカナ表記でよいなら,「サンプルサイズ」,チャンポンでも良いなら「サンプル数」です。良くある間違いですが,注意しましょう。

     [このページのトップへ]


7530. Re^2: 標本数が少ないときの適合度検定について メンデル  2005/08/27 (土) 15:17
アドバイスをありがとうございました。

> 二項検定かというお問い合わせなので,カテゴリーは2つなんで
はい。発症と非発症という区別なので,二項検定で良いだろうかと思っておりました。


> 注:Excact ではあるが,それをカイ二乗近似(正規近似)してはいけない。
申し訳ありません。当方で,文面の意味が理解できません。「カイ二乗近似してはいけない」とはどういうことなのでしょうか。検定時の注意点をお教えいただけますようお願いします。

> なお細かいことですが,「標本数」とあるのは,日本語で言うなら「標本の大きさ」カタカナ表記でよいなら,「サンプルサイズ」,チャンポンでも良いなら「サンプル数」です。良くある間違いですが,注意しましょう。
ご指摘をありがとうございました。以後,気をつけます。

合わせて,もう一つ質問があります。カイ二乗検定を用いる場合,標本の大きさはどの程度の大きさが必要になるのでしょうか。


     [このページのトップへ]


7531. Re^3: 標本数が少ないときの適合度検定について 青木繁伸  2005/08/27 (土) 17:27
> 発症と非発症という区別なので,二項検定で良いだろうかと思っておりました。

カテゴリーが3つ以上だと,多項分布になるのです。カテゴリーが2つなら,二項分布ですから,二項検定で良いのです。発症・非発症と言うことなら,発症率が母比率ですから,たとえば,母比率=0.5のように母比率を指定して検定しますね。
二 項検定の漸近近似検定としてカイ二乗分布を用いる検定がありますが,これも理論分布を指定しての検定で,上の母比率=0.5の場合には二つのカテゴリーの 期待値が全サンプル数の半分になるということですね。母比率の検定で検索すると,正規分布を用いた検定が出てきますが,これはカイ二乗分布を用いた検定と 全く同じ結果(p値)を与えます。しかし,これらは所詮近似的な検定なのです。あなたの後半の質問にあるように,近似が十分であるためにはどの程度のサン プルサイズが必要になるかいつも気にしていなければなりません。

> カイ二乗検定を用いる場合,標本の大きさはどの程度の大きさが必要になるのでしょうか。

あなたが必要とする近似の程度がどれくらいかに依存しますね。

明快な解決方法があります。それは,常に正確な検定である二項検定を行うことです。数千のサンプルサイズの場合でも二項検定を行えば良いのです。

R による例を示しておきましょう。

aa と Ab が 6 例と 4 例であった。aa も Aa も同率で発生することを検定する

> binom.test(6, 10, p=0.5, alternative="two.sided")

Exact binomial test

data: 6 and 10
number of successes = 6, number of trials = 10, p-value
= 0.7539 この p-value と
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.2623781 0.8784477
sample estimates:
probability of success
0.6

> chisq.test(c(6,4))

Chi-squared test for given probabilities

data: c(6, 4)
X-squared = 0.4, df = 1, p-value = 0.5271 この p-value を比較すると,だいぶ違うということが分かる

     [このページのトップへ]


7534. Re^4: 標本数が少ないときの適合度検定について メンデル  2005/08/27 (土) 21:09
分かりやすい具体例を用いて説明を頂きまして,ありがとうございました。遺伝性疾患の発症の分離比の検定には,二項検定を用いるようにします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 034 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る