問:Excel で最小自乗法を使って回帰直線を引くときに、Y切片をゼロ(任意の値)に固定してしまうとR^2 が1を越えたり、マイナスになったりする事があります。
今までこのようなことはやったことがなかったのですが,やってみて驚きました。(^_^;) R がゼロと表示されているのに R2 が負になったりするのですからむちゃくちゃですね。バグでしょう。 以下のテストデータを試してみたんですよ。

x 1 2 3 4 5 6 7 8 9 10
y 1 2 2 4 3 3 2 2 3 4

結果は,以下の通りだったんです。

分析ツールの回帰分析の結果の重相関係数 R,決定係数 R2(重決定というのはなんだ(^_^)),補正 R2 が変だし,図中に書き込まれる R2 も同じく変。

figure1

概要
回帰統計
重相関 R 0
重決定 R2 -0.4257885
補正 R2 -0.5368996
標準誤差 1.15357528
観測数 10
分散分析表
自由度 変動 分散 観測された分散比 有意 F
回帰 1 -3.5766234 -3.5766234 -2.6877033 #NUM!
残差 9 11.9766234 1.33073593
合計 10 8.4
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 0 #N/A #N/A #N/A #N/A #N/A #N/A #N/A
X 値 1 0.40779221 0.05879164 6.93622777 6.7876E-05 0.27479618 0.54078824 0.27479618 0.54078824

手持ちの本をいろいろ調べたのですが,このへんのことが出ている本が見つかりませんでした。(後で思い出したのですが,スネデッカー・コクラン著(畑村,奥野,津村訳)「統計的方法 原書第6版」岩波書店の6章18節「原点をとおる直線のあてはめ」というところに詳しく書いてあります。)

SPSS はどんな風にしているかなと思ってやってみて,以下のようなことであるらしいと思います。

  x  y  x^2  x・y  予測値     y^2  予測値^2
  1  1   1   1     0.40779221  1   0.16629448
  2  2   4   4     0.81558442  4   0.66517794
  3  2   9   6     1.22337662  4   1.49665036
  4  4  16  16     1.63116883 16   2.66071176
  5  3  25  15     2.03896104  9   4.15736212
  6  3  36  18     2.44675325  9   5.98660145
  7  2  49  14     2.85454545  4   8.14842975
  8  2  64  16     3.26233766  4  10.6428470
  9  3  81  27     3.67012987  9  13.4698533
 10  4 100  40     4.07792208 16  16.6294485
合計   385 157                76  64.0233766
              
a =  0.4077922 = 157 / 385
R^2 =  0.8424129 = 64.0233766 / 76 =予測値の平方和 / yの平方和
R =  0.9178305            
              
分散分析表              
    平方和   自由度  平均平方    F値      
回帰  64.023377   1   64.0233766  48.1112557      
残差  11.976623   9   1.33073593        
全体  76      10

回帰の平方和は「予測値の平方和」,全体の平方和は「yの平方和」
プログラムの出力に下手でさっぱりわけの分からない日本語訳の注が付いています(SPSS Release 6.1.2)。 曰く,
Note # 10572 原点(切片なしのモデル)の場合,R二乗は,回帰によって証明(ママ;「説明」のミスタイプだと思う)される原点につ いて,yにおける変動性の割合を測定します。これは,切片を含むモデルのR二 乗値とは,比較できません。


# 以上の記述は,1997 年 1 月 30 日の話なのだが,今だに(2002 年 3 月 6 日)最新バージョンでも直されていない。
http://support.microsoft.com/default.aspx?kbid=215559で,まるでとんちんかんなことを言っている。x や y にゼロがあるかないかの問題ではない。 そして,このバグは,遺伝し続けていくのか。

# 以上の件からも当然予想できることではあるが,定数項を含まない“重回帰分析”の場合にも同じことが起きる。正しい計算法は,上記 SPSS の計算方法を参照。(2002/12/13 追記)

# Excel 2004 から直ったようである。しかし,グラフを描いて近似曲線を追加においてR2を表示すると言うところではバグは残ったままである。(2006/10/12 追記)

・ 続き


Last modified: Jul 21, 2003

・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI