No.20679 決定係数R2について  【ひろ】 2013/12/20(Fri) 11:56

いつもお世話になっております。

Rのplsを使っていて,時々Q2の結果がマイナスになることがあります。勉強していると,以下のページが見つかりました。

http://note.chiebukuro.yahoo.co.jp/detail/n168494
http://www.ab.auone-net.jp/~biology/regline/R-Squared.htm

不勉強で,R2の定義が8つもあることを初めて知りました。当たり前だけど,同じデータで全然違う結果が算出されます。上記HPを一応読んだけど,それじゃどれを使えばいいのとの質問に困ってしまいました。

切片=0の場合,結果が異なる例があったけど,そのほかはどうでしょうか?

どうぞ宜しくお願いします。

No.20680 Re: 決定係数R2について  【青木繁伸】 2013/12/20(Fri) 21:01

> 当たり前だけど,同じデータで全然違う結果が算出されます。上記HPを一応読んだけど,それじゃどれを使えばいいのとの質問に困ってしまいました。

客観的にどれがよいということがないから8つも!!生き残っているのでしょう。

> 切片=0の場合,結果が異なる例があったけど,そのほかはどうでしょうか?

どういうことでしょうか?そのほかは結果が異ならないの?

No.20681 Re: 決定係数R2について  【ひろ】 2013/12/21(Sat) 16:07

>> 切片=0の場合,結果が異なる例があったけど,そのほかはどうでしょうか?
>どういうことでしょうか?そのほかは結果が異ならないの?

試してみました。

x<- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
y<- c(1, 2, 2, 4, 3, 3, 2, 2, 3, 4)
reg<- lm(formula = y ~ x)
summary(reg)$r.squared
[1] 0.2828283

上記データをエクセルグラフとLINEST関数(ともに切片≠0)で計算したら,同じ結果になりました。井口豊氏のHPにある”ピアソン積率相関係数の2乗”とも一致しました。

私が何かを誤解しているでしょうか?

No.20682 Re: 決定係数R2について  【青木繁伸】 2013/12/21(Sat) 16:25

> 私が何かを誤解しているでしょうか?

そもそも,何をどう誤解しているといっているのかがわからない。
意味の通る文章にしてください。

切片 0 のモデルは,lm(formula = y ~ x-1) ですし。
それとどれがどう違う,何と何が同じ結果になったといっているの?
> reg2<- lm(formula = y ~ x-1)
> summary(reg2)$r.squared
[1] 0.8424129
> summary(reg2)

Call:
lm(formula = y ~ x - 1)

Residuals:
Min 1Q Median 3Q Max
-1.2623 -0.5221 0.5727 0.9149 2.3688

Coefficients:
Estimate Std. Error t value Pr(>|t|)
x 0.40779 0.05879 6.936 6.79e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.154 on 9 degrees of freedom
Multiple R-squared: 0.8424, Adjusted R-squared: 0.8249
F-statistic: 48.11 on 1 and 9 DF, p-value: 6.788e-05
ですよ

No.20683 Re: 決定係数R2について  【ひろ】 2013/12/21(Sat) 16:30

分かりにくい文章で,すみません。

私の質問は,切片=0の場合結果が異なるけど,切片≠0の場合同じになった。これをどのように理解すればいいでしょうか?

No.20685 Re: 決定係数R2について  【青木繁伸】 2013/12/21(Sat) 20:24

> 切片=0の場合結果が異なるけど,切片≠0の場合同じになった。

どの結果が,どの結果と異なるのか?どの結果と同じになるのか?
それをあなたどう評価したのか。あなたの評価は誰のどの評価と同じなのか,誰のどの評価とは違うのか。

そもそも,あなたが 20681 で挙げたのは切片=0のモデルではないですよと私が指摘したことは,分かったのでしょうか?

「わかりにくい」のではなく,「わからない」のです。

No.20690 Re: 決定係数R2について  【ひろ】 2013/12/24(Tue) 09:00

いつもありがとうございます。

>そもそも,あなたが 20681 で挙げたのは切片=0のモデルではないですよと私が指摘したことは,分かったのでしょうか?

それは理解しています。
私の20681は,RとエクセルグラフとLINEST関数で,切片≠0の場合結果が同じになったけど,これをどう理解すればいいでしょうかとの質問でした。

>「わかりにくい」のではなく,「わからない」のです。
この2,3日,井口豊氏のHPを中心に読んでみました。しかし,以下の点がまだ完全に理解できていないので,ぜひコメントをください。

これまでの話を整理しますと,

切片=0の場合,ソフトによって使っている定義が違うため,決定係数の結果も異なります。
しかし,No.20681の結果のように,切片≠0の場合,RとエクセルグラフとLINEST関数で結果が同じとなりました。

ここから質問です。
No. 20681のデータでは,切片=0の場合ソフトによって決定係数の計算結果が異なるけど,切片≠0の場合同じ結果になりました。
以上のことを一般論できるでしょうか?つまり,使う時,切片=0の場合注意が必要ですが,切片≠0の場合注意しなくてもいいでしょうか。

どうぞよろしくお願いします。

No.20691 Re: 決定係数R2について  【青木繁伸】 2013/12/24(Tue) 09:56

一番最初の記事で,

> 切片=0の場合,結果が異なる例があったけど,そのほかはどうでしょうか?

と書いてあるから何が何かわからなかったのです。

切片=0の場合,統計計算ソフトによって結果が異なる例があったけど,そうでない場合(切片≠0の場合)は統計計算ソフトによって結果が異なるようなことはあるのでしょうか?

ということでしょう。

> 以上のことを一般論できるでしょうか?つまり,使う時,切片=0の場合注意が必要ですが,切片≠0の場合注意しなくてもいいでしょうか。

一般化も何も,それが正しい結果です。何の注意も必要ないでしょう?

No.20692 Re: 決定係数R2について  【ひろ】 2013/12/24(Tue) 10:34

青木先生
私の”分からない文章”にも関わらず,親切に対応して頂き本当にありがとうございます。

>一般化も何も,それが正しい結果です。何の注意も必要ないでしょう?

これで安心しました。
と いうのは,井口氏のHPなどを最初読んだ時,ソフトによって結果が違うだよと書いていて,これは大変だと思いました。しかし,よく読むと,切片=0の時特 に注意しろと書いているけど,切片≠0については特段議論していないようでした。そこで,切片≠0の時,大丈夫かなと思って,この質問になりました。

本当にありがとうございました。これからも宜しくお願いします。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る