No.20147 01データの相関係数  【コロン】 2013/08/23(Fri) 18:19

よろしくお願いします。調べ方が悪いのかヒットしませんでしたので,こちらに書かせて頂きます。

2つの変数があり,一つは3点満点,もう一つが1点満点(2値データ)の相関係数をRで求めるためにはどのように行えばよろしいでしょうか?また後者の変数を従属変数にした回帰分析をするにはどのようにしたらよろしいでしょうか。

パッケージみたいなものが必要でしょうか?基本的な質問で申し訳ございませんが,ご指導いただけますでしょうか。

No.20148 Re: 01データの相関係数  【コロン】 2013/08/23(Fri) 18:48

回帰分析については青木先生のご著書にありました。

ここは自己解決いたしました。相関だけご教授ください。

No.20149 Re: 01データの相関係数  【青木繁伸】 2013/08/23(Fri) 21:37

ピアソンの積率相関であろうと,スピアマンの順位相関計数やケンドールの順位相関係数であろうと,普通の変数の場合と同じく,cor 関数または cor.test 関数でよいでしょう。
属性相関係数(クラメール係数とか)を求めたいということですか?

No.20172 Re: 01データの相関係数  【コロン】 2013/08/28(Wed) 12:28

青木先生

お返事が大変遅くなりました(実はお礼の書き込みをさせて頂きましたが,一つお尋ねしなければいけないことがあり,削除しました。申し訳ございません。)

A B
2 0
1 1
3 1
2 1
2 0
3 1
2 0
1 0
2 1
1 1
2 0
3 1
3 1
3 0
3 1
2 0
3 1

上記データを分析すると値が異なります。とりあえずExcel統計というソフトでやってみました(相関の名称が示されていたので)。

ピアソン 0.2697
ケンドール 0.3007
スピアマン 0.3161

と値が異なります。これはなぜでしょうか?

No.20173 Re: 01データの相関係数  【青木繁伸】 2013/08/28(Wed) 13:14

何故違うかといわれても,それぞれの相関係数の定義が違い,何をもって相関の程度を測るかが違うからとしか。
平均値と中央値の数値が違うのだけど何故かといわれるようなもの。
> table(d)
B
A 0 1
1 1 2
2 5 2
3 1 6

> cor(d$A, d$B, method="pearson")
[1] 0.2696799

> cor(d$A, d$B, method="spearman")
[1] 0.3160987

> cor(d$A, d$B, method="kendall")
[1] 0.3007056

φ係数,分割表係数,クラメールの V は,
> library(vcd)
> t <- table(d)
> assocstats(t)
X^2 df P(> X^2)
Likelihood Ratio 5.0983 2 0.078147
Pearson 4.8109 2 0.090226

Phi-Coefficient : 0.532
Contingency Coeff.: 0.47
Cramer's V : 0.532

ポリコリック相関係数は,
> library(polycor)
> polychor(d$A, d$B)
[1] 0.3895428

No.20174 Re: 01データの相関係数  【コロン】 2013/08/28(Wed) 17:56

青木先生

お返事ありがとうございます。

>ピアソンの積率相関であろうと,スピアマンの順位相関計数やケンドールの順位相関係数であろうと,普通の変数の場合と同じく,cor 関数または cor.test 関数でよいでしょう。

私は,青木先生がお書きになった上のコメントをどうも誤解していたようです。corの引数にはpearson, spearman...と書かなくてはいけないと言うことですね。

またポリコリック相関係数について調べてみました。2値データを間隔尺度と同じ扱いで分析してしまうと過小評価された値が計算されるようです。

そこで私のデータについて改めて質問させてください。私の提示したデータでもし論文を書く場合は,ポリコリック相関係数を使った方がベターなのでしょうか。それともpearsonでも査読には耐えられるということでしょうか。

とんちんかんなことをお尋ねしていないといいのですが....。

No.20175 Re: 01データの相関係数  【青木繁伸】 2013/08/28(Wed) 18:53

> 私の提示したデータでもし論文を書く場合は,ポリコリック相関係数を使った方がベターなのでしょうか。それともpearsonでも査読には耐えられるということでしょうか。

あなたのデータが,それぞれの相関係数を計算する前提条件を満たしているかどうか,また,どのような目的でそれを計算するか(単純に有意な相関かどうかだけを見るのか,それ以上の分析に使うのかなど)によるでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る