No.06324 相関比と決定係数  【suzuki】 2008/04/10(Thu) 10:54

http://aoki2.si.gunma-u.ac.jp/R/correlation-ratio.html に「一方の変数が質的データで,もう一方の変数が量的データのときに,二変数間の関連を示す指標として相関比と決定係数を求める。」とありますが,相関比 を決定係数と呼ぶこともあるのでしょうか?次のように理解しています。「相関係数の二乗が決定係数である。例えば,変数xと変数yとの間の相関係数が 0.7の場合,決定係数は0.49で,変数xの変動の49%が変数yの変動で説明できることを意味する。相関係数は線形関係の強さを定量化するのに用いら れ,相関比は非線形(U型曲線など)関係の強さを定量化するのに用いることができる。」

No.06325 Re: 相関比と決定係数  【青木繁伸】 2008/04/10(Thu) 11:47

言葉(プログラム)が足りないと言われればそうなんですが。

ここでの決定係数は,群をダミー変数として対象変数を回帰分析(数量化 I 類と同じ)したときの決定係数(R^2)を指しているということを前提とする。
相関比 η の二乗が決定係数と等しいということです。つまり,相関比は重相関係数と同じになる。η=R,η^2=R^2
> dat <- matrix(c(rep(1:3, each=4), 3, 3, 4, 2, 5, 2, 3, 4, 8, 8, 5, 6), nc=2)
> df <- as.data.frame(dat)
> df$V1 <- factor(df$V1)
> ans <- lm(V2~V1, df)
> ans

Call:
lm(formula = V2 ~ V1, data = df)

Coefficients:
(Intercept) V12 V13
3.00 0.50 3.75

> summary(ans)

Call:
lm(formula = V2 ~ V1, data = df)

Residuals:
Min 1Q Median 3Q Max
-1.750e+00 -8.125e-01 2.107e-16 1.063e+00 1.500e+00

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.000 0.618 4.854 0.000903 ***
V12 0.500 0.874 0.572 0.581275
V13 3.750 0.874 4.291 0.002018 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.236 on 9 degrees of freedom
Multiple R-squared: 0.7069, Adjusted R-squared: 0.6418 # 決定係数(重相関係数の二乗)
F-statistic: 10.85 on 2 and 9 DF, p-value: 0.003994

# 相関比
> correlation.ratio(dat[,2], dat[,1])
[1] 0.8407896
# 相関比の二乗
> correlation.ratio(dat[,2], dat[,1])^2
[1] 0.7069272

No.06328 Re: 相関比と決定係数  【suzuki】 2008/04/10(Thu) 16:33

迅速な対応をありがとうございます。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る