★ 原点を通る回帰直線のR^2について ★

337. 原点を通る回帰直線のR^2について 岡庭 三鶴 2003/07/15 (火) 00:28
└338. Re: 原点を通る回帰直線のR^2について 青木繁伸 2003/07/15 (火) 05:19
 └339. Re^2: 原点を通る回帰直線のR^2について 岡庭 三鶴 2003/07/15 (火) 07:20


337. 原点を通る回帰直線のR^2について 岡庭 三鶴  2003/07/15 (火) 00:28
青木先生が指摘されているMS-Excelのツールのバグの話から,基本的な部分で疑問が生じました。
同じデータを切片が0の場合と0でない場合で回帰分析し,R^2を算出すると,実際は直線の当てはまりが切片が0の方が,切片0でない直線より悪い結果となっても,なぜか「R^2」の方は,逆に切片0でない直線の「R^2」より高くなってしまいます。これは,どう解釈すればよいのでしょうか?
具体的には,MS-Excelのツールのバグの話の10個のデータ
x:1,2,3,4,5,6,7,8,9,10
y:1,2,2,4,3,3,2,2,3,4
において,
切片0(原点を通る)場合,R^2=0.8424129 (予測値の平方和/yの平方)
切片0でない場合,R^2=0.282828
これは,SPSSのNote # 10572 で説明されていることなんでしょうが,切片0(原点を通る)場合の「R^2」が切片0でない場合の「R^2」に比べかなり高く出るので,変な気がします。そういうものと割り切ればいいのでしょうか・・・?

     [このページのトップへ]


338. Re: 原点を通る回帰直線のR^2について 青木繁伸  2003/07/15 (火) 05:19
> 同じデータを切片が0の場合と0でない場合で回帰分析し,R^2を算出すると,実際は直線の当てはまりが切片が0の方が,切片0でない直線より悪い結果となっても,なぜか「R^2」の方は,逆に切片0でない直線の「R^2」より高くなってしまいます。これは,どう解釈すればよいのでしょうか?

両者は全く異なるものですから,比較してはいけない(比較できない)のです。
(異なるというのは,平均値周りと,原点周りの違い)

     [このページのトップへ]


339. Re^2: 原点を通る回帰直線のR^2について 岡庭 三鶴  2003/07/15 (火) 07:20
> > 同じデータを切片が0の場合と0でない場合で回帰分析し,R^2を算出すると,実際は直線の当てはまりが切片が0の方が,切片0でない直線より悪い結果となっても,なぜか「R^2」の方は,逆に切片0でない直線の「R^2」より高くなってしまいます。これは,どう解釈すればよいのでしょうか?
>
> 両者は全く異なるものですから,比較してはいけない(比較できない)のです。
> (異なるというのは,平均値周りと,原点周りの違い)
早々とありがとうございました。
そうすると,原点が0を通る場合のR^2は,かなり高めの値が出ます(先の例でも0.8以上で,原点が0を通らない回帰分析でもしR^2=0.8なら当てはまりがよいと判断できる)が,高いから当てはまり良いという絶対評価的な見方ではなく,他の原点0のモデルとの比較検討に使うというのが妥当ですね。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 025 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る