今日(1997 年 1 月末),ネットニューズを読んでいると類似のバグが報告されていました。こちらは,折れ線グラフを描いた後,「近似曲線」メニューで回帰直線を描いてみたら変だったというお話。

分析ツールの回帰分析の結果は正しいみたいだけど,図中に書き込まれる近似曲線の式の係数が間違っている。

x 5 10 15 20 25 30
y 20 28 32 40 40 48

figure2

概要
回帰統計
重相関 R 0.98221263
重決定 R2 0.96474164
補正 R2 0.95592705
標準誤差 2.10215309
観測数 6
分散分析表
自由度 変動 分散 観測された分散比 有意 F
回帰 1 483.657143 483.657143 109.448276 0.00047177
残差 4 17.6761905 4.41904762
合計 5 501.333333
係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 16.2666667 1.95699802 8.31205063 0.00114428 10.8331578 21.7001755 10.8331578 21.7001755
X 値 1 1.05142857 0.10050214 10.461753 0.00047177 0.77238932 1.33046783 0.77238932 1.33046783

ま,「折れ線グラフ」を描いたのが一つの問題。
「散布図」を描いたら良かったのに。「散布図」の編集で近似曲線を描くとちゃんとできるみたいだけどね。

でも,そもそもExcel の「折れ線グラフ」は横軸が「項目」になっているので,近似曲線をオプションに付けようというのがわからん。横軸は,必ずしも数値軸じゃないんだからね。というか,数値軸じゃないほうが多いんでは?

追記 2003/01/16
なぜこんな不思議なバグがあるかと思っていたが,先日とあるページで,「マイクロソフトに問い合わせたら,バグではないといわれた。このような場合には,横軸には【1から始まる整数値という暗黙のxが仮定されるのだ】といわれた。納得行かない」と書いてあった。なるほど,マイクロソフトらしい対応だ。
確かに,
x 1 2 3 4 5 6
y 20 28 32 40 40 48

というデータで,回帰分析をやると

            係数
切片	16.26666667
X 値 1	5.257142857
という結果になり,「散布図」で書かせた近似曲線の式と同じになる。
figure3

・ 続き


Last modified: Mar 28, 2003

・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI