No.06690 100%を超える比率の差の検定について  【daisuke】 2008/06/05(Thu) 05:55

はじめまして。
質問したいことがあり,書き込み致します。

χ2検定により比率の差の検定及び,その後の多重比較を行おうとしています。具体的には,A群(10名)とB群(20名)とC群(22名)における群間の比較です。各群の人たちに記述式の調査を行い,その回答内容から設定カテゴリー出現率の比較を行おうとしています。

例えば,カテゴリー名「情意的な意識」についての記述がA群では8個,B群では6個,C群では11個見られた場合は,χ2検定を行うことができます。すなわち,A群(出現8,未出現2),B群(出現6,未出現14),C群(出現11,未出現11)として検定可能。
しかし,あるカテゴリーについては,いずれの群でも出現数が多く,A群20個,B群33個,C群では25個のようになり,出現数を群の人数で割ると出現率が100%を超えてしまうため,χ2検定ができません。
このような場合どうすればよろしいでしょうか?何か方法があれば教えて頂けますと幸いです。
恐れ入りますが,よろしくお願い致します。

No.06692 Re: 100%を超える比率の差の検定について  【青木繁伸】 2008/06/05(Thu) 10:32

> あるカテゴリーについては,いずれの群でも出現数が多く,A群20個,B群33個,C群では25個のようになり,出現数を群の人数で割ると出現率が100%を超えてしまうため

こ れは,定義がおかしいのです。あなたが計算したのは,「合計出現数/合計人数*100」ですが,100倍したから%のように見えてしまっているのでしょう が,「合計出現数/合計人数」が何を意味するか,冷静に考えてみればわかるでしょう。そう,それは,一人あたりの出現数つまり,平均出現数ですよ。
カ イ二乗検定の対象は,割合ではなく,個数(個体数)なのです。割合は,ある条件を満たす個体数を全体の個体数で割ったものです。すなわち,カイ二乗検定 は,分母と分子が同じ測定単位(つまり個体数)です。あなたのデータのように,分子が出現数,分母が人数というのはカイ二乗検定の対象になるような分割表 ではありません。

あなたのデータは,一人一人について以下のようになっているのではないですか
---------------------------
被検者  出現数   所属群
---------------------------
A1 1 A
A2      0 A
: : :
A10 2 A
---------------------------
B1 1 B
B2 3 B
: : :
B20 2 B
---------------------------
C1 4 C
C2 6 C
: : :
C22 7 C
---------------------------
このようになっているのでしょう?
このデータ構造を見ればわかるように,これはむりやり集計表を作ってカイ二乗検定をするようなものではありません。あなたの定義する比率が100%を超えないものであってもです。
このデータは,三群の出現数の平均値(代表値)の差の検定を行うべきものでしょう。

No.06701 Re: 100%を超える比率の差の検定について  【daisuke】 2008/06/06(Fri) 06:27

青木様

ご丁寧な説明を賜りまして,ありがとうございます。

出現数を量的なデータとして扱い,(一元配置により)3群の平均値の比較をt検定により行うということでしょうか?実行してみます。

No.06702 Re: 100%を超える比率の差の検定について  【青木繁伸】 2008/06/06(Fri) 12:00

> 3群の平均値の比較をt検定により行う

3群の平均値の差の検定は,一元配置分散分析(それをスキップして多重比較でも可)
3群の代表値の差の検定は,クラスカル・ウォリス検定(それをスキップして多重比較でも可)

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る