Excel での回帰分析

今日（1997 年 1 月末），ネットニューズを読んでいると類似のバグが報告されていました。こちらは，折れ線グラフを描いた後，「近似曲線」メニューで回帰直線を描いてみたら変だったというお話。

分析ツールの回帰分析の結果は正しいみたいだけど，図中に書き込まれる近似曲線の式の係数が間違っている。

x 5 10 15 20 25 30

y 20 28 32 40 40 48

概要

回帰統計

重相関 R 0.98221263

重決定 R² 0.96474164

補正 R² 0.95592705

標準誤差 2.10215309

観測数 6

分散分析表

自由度変動分散観測された分散比有意 F

回帰 1 483.657143 483.657143 109.448276 0.00047177

残差 4 17.6761905 4.41904762

合計 5 501.333333

係数標準誤差 t P-値下限 95% 上限 95% 下限 95.0% 上限 95.0%

切片 16.2666667 1.95699802 8.31205063 0.00114428 10.8331578 21.7001755 10.8331578 21.7001755

X 値 1 1.05142857 0.10050214 10.461753 0.00047177 0.77238932 1.33046783 0.77238932 1.33046783

ま，「折れ線グラフ」を描いたのが一つの問題。
「散布図」を描いたら良かったのに。「散布図」の編集で近似曲線を描くとちゃんとできるみたいだけどね。

でも，そもそもExcel の「折れ線グラフ」は横軸が「項目」になっているので，近似曲線をオプションに付けようというのがわからん。横軸は，必ずしも数値軸じゃないんだからね。というか，数値軸じゃないほうが多いんでは？

追記 2003/01/16
なぜこんな不思議なバグがあるかと思っていたが，先日とあるページで，「マイクロソフトに問い合わせたら，バグではないといわれた。このような場合には，横軸には【1から始まる整数値という暗黙のxが仮定されるのだ】といわれた。納得行かない」と書いてあった。なるほど，マイクロソフトらしい対応だ。
確かに，

x 1 2 3 4 5 6

y 20 28 32 40 40 48

というデータで，回帰分析をやると

            係数
切片	16.26666667
X 値 1	5.257142857

という結果になり，「散布図」で書かせた近似曲線の式と同じになる。

続き

Last modified: Mar 28, 2003

直前のページへ戻る　　 E-mail to Shigenobu AOKI

概要

回帰統計
重相関 R	0.98221263
重決定 R²	0.96474164
補正 R²	0.95592705
標準誤差	2.10215309
観測数	6

分散分析表
	自由度	変動	分散	観測された分散比	有意 F
回帰	1	483.657143	483.657143	109.448276	0.00047177
残差	4	17.6761905	4.41904762
合計	5	501.333333

	係数	標準誤差	t	P-値	下限 95%	上限 95%	下限 95.0%	上限 95.0%
切片	16.2666667	1.95699802	8.31205063	0.00114428	10.8331578	21.7001755	10.8331578	21.7001755
X 値 1	1.05142857	0.10050214	10.461753	0.00047177	0.77238932	1.33046783	0.77238932	1.33046783