No.06692 Re: 100%を超える比率の差の検定について 【青木繁伸】 2008/06/05(Thu) 10:32
> あるカテゴリーについては,いずれの群でも出現数が多く,A群20個,B群33個,C群では25個のようになり,出現数を群の人数で割ると出現率が100%を超えてしまうため
こ れは,定義がおかしいのです。あなたが計算したのは,「合計出現数/合計人数*100」ですが,100倍したから%のように見えてしまっているのでしょう が,「合計出現数/合計人数」が何を意味するか,冷静に考えてみればわかるでしょう。そう,それは,一人あたりの出現数つまり,平均出現数ですよ。
カ イ二乗検定の対象は,割合ではなく,個数(個体数)なのです。割合は,ある条件を満たす個体数を全体の個体数で割ったものです。すなわち,カイ二乗検定 は,分母と分子が同じ測定単位(つまり個体数)です。あなたのデータのように,分子が出現数,分母が人数というのはカイ二乗検定の対象になるような分割表 ではありません。
あなたのデータは,一人一人について以下のようになっているのではないですか---------------------------このようになっているのでしょう?
被検者 出現数 所属群
---------------------------
A1 1 A
A2 0 A
: : :
A10 2 A
---------------------------
B1 1 B
B2 3 B
: : :
B20 2 B
---------------------------
C1 4 C
C2 6 C
: : :
C22 7 C
---------------------------
このデータ構造を見ればわかるように,これはむりやり集計表を作ってカイ二乗検定をするようなものではありません。あなたの定義する比率が100%を超えないものであってもです。
このデータは,三群の出現数の平均値(代表値)の差の検定を行うべきものでしょう。
No.06701 Re: 100%を超える比率の差の検定について 【daisuke】 2008/06/06(Fri) 06:27
青木様
ご丁寧な説明を賜りまして,ありがとうございます。
出現数を量的なデータとして扱い,(一元配置により)3群の平均値の比較をt検定により行うということでしょうか?実行してみます。
No.06702 Re: 100%を超える比率の差の検定について 【青木繁伸】 2008/06/06(Fri) 12:00
> 3群の平均値の比較をt検定により行う
3群の平均値の差の検定は,一元配置分散分析(それをスキップして多重比較でも可)
3群の代表値の差の検定は,クラスカル・ウォリス検定(それをスキップして多重比較でも可)
● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る