No.01073 エクセルの回帰分析  【FLOWER】 2006/09/13(Wed) 11:18

すみません。統計初心者です。
全国資源消費量と県の資源消費量の1980年から2000年までのデータの相関を見たかったので,エクセルで,片方を目的変数,もう片方を変数として回帰分析をしてみました。
そこで,問題が生じました。
エクセルの回帰分析をする際,「定数項を0にする」というのをチェックすると,
決定係数が0.9をかるくこえてしまします。チェックをはずすと,決定家数は0.26です。
どうしてこんなことがおこるのか教えてください。
宜しくお願いいたします。

No.01075 Re: エクセルの回帰分析  【R初心者】 2006/09/13(Wed) 14:27

http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/11.html

上のページでも記述されていますが,明らかなバグです。
Excelを利用する場合定数項は0にしない方がいいでしょう。
それでなければRを使った方がいいと思います。

No.01078 Re: エクセルの回帰分析  【青木繁伸】 2006/09/13(Wed) 19:08

この現象は,上記のバグとは無関係かも知れません。もっとも,エクセルは原点を通る回帰直線の決定係数の計算がバグっているので,間違っているのには変わりません。

使ったデータがどのようなのか正確にわかりませんが,散らばりより原点からの距離が遙かに大きいデータのような場合には,データ間の相関が低くても,原点を通る回帰直線の決定係数はべらぼうに大きくなることがあります。
Rで示すと以下のようになります。同じ現象が出ます。

x, yに定数を加えたり引いたりすれば,原点を通る回帰直線の決定係数が大幅に変化するのを確認できます。切片をもつ回帰直線の場合にはそんなことはありません(いつも同じ決定係数です)。
> x <- c(91.9, 99.8, 105.2, 77.1, 102.4, 116.1, 106.9, 95.1, 98.9, 106.6)
> y <- c(110.2, 104.8, 100.2, 81.7, 98, 97.4, 111, 93.4, 88.3, 115)
> cor(x, y)
[1] 0.5105723 # 相関係数
> ans1 <- lm(y~x) # 切片を持つ直線回帰
> ans2 <- lm(y~x-1) # 原点を通る直線回帰
> summary(ans1)

Call:
lm(formula = y ~ x)

Residuals:
Min 1Q Median 3Q Max
-11.138 -5.977 -2.841 6.832 14.337

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 48.9233 30.5628 1.601 0.148 # 切片を持つ回帰直線
x 0.5108 0.3041 1.680 0.132

Residual standard error: 9.609 on 8 degrees of freedom
Multiple R-Squared: 0.2607, Adjusted R-squared: 0.1683 # 決定係数=0.2607
F-statistic: 2.821 on 1 and 8 DF, p-value: 0.1316

> summary(ans2)

Call:
lm(formula = y ~ x - 1)

Residuals:
Min 1Q Median 3Q Max
-18.138 -4.345 1.688 5.355 18.744

Coefficients:
Estimate Std. Error t value Pr(>|t|)
x 0.99516 0.03276 30.38 2.22e-10 *** # 原点を通る回帰直線
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 10.41 on 9 degrees of freedom
Multiple R-Squared: 0.9903, Adjusted R-squared: 0.9893 # 決定係数=0.9903ワオ
F-statistic: 923 on 1 and 9 DF, p-value: 2.220e-10

> plot(x, y, xlim=c(0, 120), ylim=c(0, 120))
> abline(ans1, col="red") # 赤は普通の回帰直線
> abline(ans2, col="blue") # 青は原点を通る回帰直線


教訓としては,
原点を通る直線回帰って,なんのためにあるんだ??

fig


● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る