No.08408 Re: 青木先生 【青木繁伸】 2008/11/27(Thu) 10:15
質問のような2値データの場合,相関係数(ピアソンの積率相関係数)の絶対値と,カイ二乗検定で計算されるカイ二乗値に基づくφ係数は,同じ値になります。なので,カイ二乗検定をやっても,検定結果は同じです。
検 定を行う前に行方向(列方向でも良いけど)のパーセントを計算してみてください。Aの高い群と低い群で,Bの高いものの割合を比べるわけです。そうするだ けで,あなたの仮説が正しそうかそうでないかわかると思いますよ。(検定を行うのは,差がありそうだ・その差は意味のある差だとわかった後の話)。
No.08414 Re: 青木先生 【真田】 2008/11/27(Thu) 14:32
青木先生
回答ありがとうございます。
>検定を行う前に行方向(列方向でも良いけど)の パーセントを計算してみてください。Aの高い群と低い群で,Bの高いものの割合を比べるわけです。そうするだけで,あなたの仮説が正しそうかそうでないか わかると思いますよ。(検定を行うのは,差がありそうだ・その差は意味のある差だとわかった後の話)。
その通りです。
検定をするまでもなかったのですね。
しかし,得点間の相関がみられなかったことを教授に話,SPSSでの以下の結果をみせたところ,「このような値がでることはおかしい」と言われました。
相関係数:0.014
有意確率(両側):0.877
n=130
私自身もいろいろな本を読みましたが,なぜこのような値が出たのか,このような値が出たということは私のSPSSの操作ミスなのか,また,このような値がでることはありえないことなのか,よくわかりません。
何度も質問をしてしまい,申し訳ございません。
よろしくお願いいたします。
真田
No.08415 Re: 青木先生 【青木繁伸】 2008/11/27(Thu) 14:54
どのように「おかしい」のか,理由は聞きませんでしたか?> f <- matrix(c(30, 33, 31, 36), 2, 2)以上のことは(P 値をもとめることは別として),電卓があれば確かめられますよ。カイ二乗検定もね。
> dimnames(f) <- list(A=c("高群", "低群"), B=c("高群", "低群"))
> f # あなたのデータですね
B
A 高群 低群
高群 30 31
低群 33 36
> (A <- rep(row(f), f)) # A の元のデータはこうなっているわけです
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2
[38] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1
[75] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
[112] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
> (B <- rep(col(f), f)) # B の元のデータです
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
[75] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
[112] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
> cor.test(A, B) # A と B の相関係数を求めて無相関検定をしたのですね?
ピアソンの積率相関係数
データ: A と B
t値 = 0.153, 自由度 = 128, P値 = 0.8786 # ここの P 値はあなたの結果「有意確率(両側):0.877」と同じですね(丸め誤差が入っている?)
対立仮説: 母相関は,0ではない
95 パーセント信頼区間: -0.1590333 0.1852778
標本推定値:
相関係数
0.01352315 # (★)これがあなたの結果「相関係数:0.014」と同じですね
# ここまでをまとめると,要するに A と B は無相関ということ
> chisq.test(A, B) # いわゆるカイ二乗検定です
ピアソンのカイ二乗検定(イエーツの連続性補正)
データ: A と B
カイ二乗値 = 5e-04, 自由度 = 1, P値 = 0.9827 # ここの P 値に注目
# 要するに A と B は独立である(関連がない)
> chisq.test(A, B, correct=FALSE) # 連続性の補正をしない場合
ピアソンのカイ二乗検定(連続性補正なし)
データ: A と B
カイ二乗値 = 0.0238, 自由度 = 1, P値 = 0.8775 # ここの P 値に注目
# 検定結果は同じ。要するに A と B は独立である(関連がない)
> sqrt(0.0238/130) # φ係数です(カイ二乗値をデータ数で割って,平方根を取る)
[1] 0.01353059 # 前に計算した相関係数(★)と全く同じ数値になりますね
正確に計算すれば sqrt(0.02377381/130) = 0.01352315 になります
カイ二乗検定のページ
http://aoki2.si.gunma-u.ac.jp/lecture/Cross/cross.html
No.08418 Re: 青木先生 【真田】 2008/11/27(Thu) 15:24
青木先生
わかりやすい回答ありがとうございます。
先生の仰っていることはなんとなく理解できたと思います。
>どのように「おかしい」のか,理由は聞きませんでしたか?
その理由として,「130名ぐらいを対象にした調査で,このような危険率(有意確率)がでることはそうそうない。統計処理,SPSSの操作ミスではないか」とのことでした。
SPSSは確かに初心者ですが,いくつか本を読み,ピアソンの積率相関,スピアマンの順位相関の操作に不安を感じたことはありません。
一つの尺度の得点分布に正規性が見られなかったため,順位相関も行いましたが,そちらの有意確率も「おかしい」と言われました。
大きな疑問は,先生の言う「このような結果となることはあまりない」ことが今回のデータでは起こっているのかという点です。
よろしくお願いします。
No.08419 Re: 青木先生 【青木繁伸】 2008/11/27(Thu) 15:27
> 130名ぐらいを対象にした調査で,このような危険率(有意確率)がでることはそうそうない。
その教授先生は,何か勘違いをしているのではないですか?
有意確率が大きい方が有意であるとか?
あ なたが集計した130人の1000倍,130000人に調査したとしましょう。同じ母集団からの抽出だから,正確に下のようにはならなくてもそれに近い数 字になるでしょう。そして,その集計結果をカイ二乗検定すると,あらまあ不思議,P値は 1.114e-06 になりますよ。見慣れない表記でしょうが,これは,0.000001114 ということで,有意な差であるということになります。しかし,有意になっても,行の%を取ってみればわかるように,A と B の関係はない(1000倍する前のものと同じ)ということですからね。> f2 <- f*1000つまり,
> f2
B
A 高群 低群 # 各セルも1000倍!!!
高群 30000 31000
低群 33000 36000
> chisq.test(f2)
ピアソンのカイ二乗検定(イエーツの連続性補正)
データ: f2
カイ二乗値 = 23.7196, 自由度 = 1, P値 = 1.114e-06 # 途方もなく小さい!!
もし,あなたが130名という少ない人数の調査の結果 A と B は有意な関連がある。P 値はかなり小さな値だとすれば,教授のいうことはもっともかも知れない。たかが130名でそんなことがいえるわけない。。。と。
しかし,130人で帰無仮説が棄却されているんですから,130名が多いの少ないのという必要はない。悔しかったらもっとデータを集めましょうといえばよいだけ。
「130名ぐらいを対象にした調査で,このような危険率(有意確率)がでることはそうそうない。」という陳述で,前半と後半が矛盾している。
なんか,説明していても,むなしい気分になる
No.08421 Re: 青木先生 【真田】 2008/11/27(Thu) 16:46
何度もわかりやすく解説していただいて申し訳ございません。
私自身,教授の言っている意味が理解できませんでしたが,青木先生の丁寧な説明で,教授が前述のようなことを言った理由は,何か勘違い,もしくは,特に根拠もなく言ったのではと思っています。
説明不足でご迷惑をおかけしました。
ありがとうございました。
No.08427 Re: 青木先生 【にゃんちゅう】 2008/11/27(Thu) 20:11
(1)
>「A得点が高い人はB得点が低い」または「A得点が低い人はB得点が高い」との仮説を立てたました。
アンケートを回収し,A,Bの得点を高群・低群に分け,以下のようなクロス表を作成しました。
(2)
>しかし,得点間の相関がみられなかったことを教授に話,SPSSでの以下の結果をみせたところ,「このような値がでることはおかしい」と言われました。
(2)は統計処理が間違っているという意味ではなく,(1)の仮説どおりの結果がであるはずなのにでないのはおかしいといっているのでしょう。
つまり,問いかけがおかしいか,被験者がまじめに答えなかったかなどのなんらかの困ったことが起こっている可能性があるという意味ではないでしょうか。
No.08428 Re: 青木先生 【青木繁伸】 2008/11/27(Thu) 20:48
> 仮説どおりの結果がであるはずなのにでないのはおかしいといっている
なるほど。そう考えるのが妥当ですね。仮説を証明するには130名は十分なのに,帰無仮説を棄却できないのはともかく,こんな高いP値が出るのはおかしいということですね。
● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る