No.07739 x2独立性の検定 mxn分割表の解釈  【かずと】 2008/09/24(Wed) 23:30

質問です。よろしくお願いします。
3種の腫瘍,3種の発育分類,3種の見え方,についてのデータがあります。

3種の見え方と3種の発育分類との間に関連があるのかどうかを検定したい場合,
帰無仮説:「2要因に関連はない」
x2独立性の検定 mxn分割表を用いようと思いますが,このセンスは正しいでしょうか?

仮に,正しいとして,当方の結果ではp<0.05,クラメールのV値0.61という結果が出ていますが,この解釈はどのように考えればよいのでしょうか?
帰無仮説は棄却されたので「関連はある」とのことだと思いますが,どのように関連があるか,よくわかりません。
またクラメールV値は関連性の強さを表すとのことですが,0.61とはどのような解釈をすればよいのでしょうか?

よろしくお願いします。

No.07741 Re: x2独立性の検定 mxn分割表の解釈  【波音】 2008/09/25(Thu) 01:00

> x2独立性の検定 mxn分割表を用いようと思いますが,このセンスは正しいでしょうか?

得られているデータが計数データならばそれが適切だと思いますよ。

> 0.61とはどのような解釈をすればよいのでしょうか?

0 から1の値をとりますから,0なら全然関連がない,1なら完全に関連がある,といえますから,0.61だとやや強い関連を示すというような解釈になるで しょう。「やや強いとはどの程度ですか?」と聞かれたらなかなか返答に困りますが,,, 結局,0.61がどれほどの関連を示すかは分野によって評価の度 合いが違ってくるということでしょうね。

> どのように関連があるか,よくわかりません。

数値が示すのは「連関の強さ」ですから,仮に0.89という値が求められたとしても「AとBには強い連関がある」としかいえないわけです(数値からだけでは)。どういう関連があるかというと,それは各セルの度数を見て分析者が判断するということでしょう。

例えば,

    映画好き 映画嫌い
男性   5     33
女性   38     10

と いうデータはクラメールの連関係数が0.6556101となり,ちょうどかずとさんの値と似たようなものですが,検定の結果らいえることは「性別と映画の 好き嫌いには関連がある」といえるだけでしょう。ですが,実際にセルの計数をみると,どうやら女性の方が映画好きが多いのだろうということが分かるわけで す(これは分析者が解釈する部分)。

分析者がどのように解釈するか,それを数値で説得力を持たせるという感じで理解しておけば良いとおもいますよ。

No.07765 Re: x2独立性の検定 mxn分割表の解釈  【かずと】 2008/09/26(Fri) 05:47

返答有難う御座いました。
また,適切な例題も感謝致します。
例えば,論文などにデータを載せる場合,クラメールの値を表示したほうが丁寧でしょうか?あるいは混乱を招くだけでしょうか?(僕の経験ではクラメールという言葉自体見たことがないものですから,通常,私の分野ではp値重視で表現されていることが多いのかも)

No.07770 Re: x2独立性の検定 mxn分割表の解釈  【波音】 2008/09/26(Fri) 12:11

> クラメールの値を表示したほうが丁寧でしょうか?あるいは混乱を招くだけでしょうか?

多くの場合,カイ自乗検定(独立性の検定)の結果だけ載せておけば,わざわざ連関係数を載せる必要がないのかもしれません。

ク ラメールの連関係数は独立性の検定でp値がかなり小さい場合であっても(関連があると認められても),あまり大きな値をとらないので場合によっては混乱を 招くこともあるかもしれません。提示した例でもp = 4.553e-09でV = 0.6556101ですからね(Vはそれほど大きな値ともいえない)。

No.07771 Re: x2独立性の検定 mxn分割表の解釈  【青木繁伸】 2008/09/26(Fri) 12:40

> クラメールの連関係数は独立性の検定でp値がかなり小さい場合であっても(関連があると認められても),あまり大きな値をとらないので場合によっては混乱 を招くこともあるかもしれません。提示した例でもp = 4.553e-09でV = 0.6556101ですからね(Vはそれほど大きな値ともいえない)。

2×2分割表におけるクラメールの係数は,φ係数と等しく,さらに2つのカテゴリーを二値データと見なして計算したときのピアソンの積率相関係数の絶対値と同じです。ということで,ピアソンの相関係数で 0.6556101 というのは,かなり大きい値です。
おわかりとは思いますが,P値は統計量の大きさと同時にサンプルサイズにも依存するので,「P 値が小さいのに統計量はさほど大きくない」という論旨の運びは正確ではありません。
> d <- matrix(c(5,33,38,10),2)
> x <- rep(row(d), d)
> y <- rep(col(d), d)
> cor(x, y)
[1] -0.6556101

No.07773 Re: x2独立性の検定 mxn分割表の解釈  【波音】 2008/09/26(Fri) 13:05

補足ありがとうございます。

> 提示した例でもp = 4.553e-09でV = 0.6556101ですからね

という表現は,ご指摘いただいたように,

> P 値が小さいのに統計量はさほど大きくない」という論旨の運びは正確ではありません。

の通りで,誤解を招くような表現をしてしまいました。

No.07788 Re: x2独立性の検定 mxn分割表の解釈  【かずと】 2008/09/28(Sun) 22:50

丁寧な解説,どうも有難う御座いました。
全部理解できているわけでは,到底ありませんが,当方のデータに自信が持てた上に,統計方法に確信が持てました。

No.07789 Re: x2独立性の検定 mxn分割表の解釈  【にゃんちゅう】 2008/09/29(Mon) 08:49

クラメールのV値はクロス表の「効果量」となってます。アメリカ心理学会では,効果量を論文に入れるよう指導しています。という意味で,検定のほかにクラメールのV値を記述することは推奨されることです。

その大きさの解釈はCohen の暫定的な案がとりあえずよく使われます。0.5以上なので大きいです。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る