No.09294 2グループ間でのある特性の割合の比較について  【Grace】 2009/02/20(Fri) 05:26

初歩的な質問で申し訳ないのですが,グループAとグループBがあったとして(それぞれの人数は不明),その中での糖尿病罹患率がそれぞれ7%と32%だったとします。
その場合,グループAとグループBにおいて糖尿病罹患率に差があると統計学的に証明することはできるのでしょうか? (たとえば7,32,93,68でフィッシャーのエグザクトテストをするなど)それとも,グループの人数が分からないと無理なのでしょうか?
どうぞよろしくご指導ください。

No.09295 Re: 2グループ間でのある特性の割合の比較について  【青木繁伸】 2009/02/20(Fri) 06:36

人数がわからないと,どんな検定も出来ません。

適当に人数を仮定して何通りかやってみるとよいです。できないわけではないけど,不適切だと言うことがわかるでしょう。
> sim <- function(Na, Nb)
+ {
+ tbl <- round(matrix(c(Na*0.07, Na*0.93, Nb*0.32, Nb*0.68), 2, byrow=TRUE), 0)
+ print(tbl)
+ print(fisher.test(tbl))
+ }
> sim(14, 25)
[,1] [,2]
[1,] 1 13 # 1/14=0.0714285
[2,] 8 17 # 8/25=0.32

Fisher's Exact Test for Count Data

data: tbl
p-value = 0.1189 # 帰無仮説棄却


> sim(100, 100)
[,1] [,2]
[1,] 7 93 # 7/100=0.07
[2,] 32 68 # 32/100=0.32

Fisher's Exact Test for Count Data

data: tbl
p-value = 1.056e-05 # 帰無仮説採択  同じ%なのに,上の例と矛盾する結果

No.09298 Re: 2グループ間でのある特性の割合の比較について  【kai】 2009/02/20(Fri) 08:08

人数が全くわからないのであれば無理ですが,それぞれ何人以上はいるという情報があれば,検定で有意差がでるかもしれません.

人数がわからなければ,データの信頼性が不明なので評価のしようがありません.

No.09299 Re: 2グループ間でのある特性の割合の比較について  【青木繁伸】 2009/02/20(Fri) 08:59

> それぞれ何人以上はいるという情報があれば,検定で有意差がでるかもしれません

基本的には,分割表が再現できない限り,検定は出来ません。
全数がわかっていても,パーセントの精度が低ければ,正確な分割表が再現できません。丸められたパーセントから再現できる(矛盾のない)分割表に対して検定ができることもありますが,それら全てで同じ結果になると言う保証はありませんから。

No.09301 Re: 2グループ間でのある特性の割合の比較について  【kai】 2009/02/20(Fri) 10:20

例えば,A,B各グループでそれぞれ1000人以上いるとして,7%と32%という結果がわかっているのであれば,差があると判定できるのでは???

No.09302 Re: 2グループ間でのある特性の割合の比較について  【青木繁伸】 2009/02/20(Fri) 11:24

> 例えば,A,B各グループでそれぞれ1000人以上いるとして

そのような場合も含めてできないと言っているわけではありません。

No.09303 Re: 2グループ間でのある特性の割合の比較について  【Grace】 2009/02/20(Fri) 11:55

皆様,早速のご返信ありがとうございます。
確かに人数が異なると,違う結果がでてしまいました。
今回のグループの人数はそれぞれ100人未満なので,パーセントの比較は適切ではないという理解でよろしいのでしょうか。

No.09304 Re: 2グループ間でのある特性の割合の比較について  【青木繁伸】 2009/02/20(Fri) 12:00

二群の人数は分かっていないのですか?
疫学(医学)関連の論文で例数が記載されていないというのは欠陥論文ですね。

No.09305 Re: 2グループ間でのある特性の割合の比較について  【Grace】 2009/02/20(Fri) 12:16

お返事ありがとうございます。
学術論文ではないのですが,ある文章の中で糖尿病の罹患率の違いについての文章を見ましたので,それを統計学的に証明することはできるのかなと思ったのです。
人数がわかっていれば,人数に基づいて分割表を作って検定するのが一番いいのですね。
拙い質問にお答えいただき,ありがとうございます。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る