ダミー変数を使う重回帰分析の例     Last modified: Aug 25, 2004

重回帰分析による売り上げ予測

6年間の各月別売り上げ実績データがある。

データ行列

 売り上げ 前年 番号   気温 2月 4月 7月 12月
      226  191    0    3.3   0   0   0    0
      212  203    1    3.6   1   0   0    0
      231  198    2    6.7   0   0   0    0
      249  211    3   13.3   0   1   0    0
      251  221    4   17.4   0   0   0    0
      243  227    5   20.7   0   0   0    0
      313  293    6   25.0   0   0   1    0
      255  249    7   26.8   0   0   0    0
      268  238    8   22.5   0   0   0    0
      244  236    9   16.0   0   0   0    0
      229  232   10   11.0   0   0   0    0
      262  248   11    6.1   0   0   0    1
      237  226   12    3.6   0   0   0    0
      225  212   13    3.8   1   0   0    0
       途中省略
      336  328   70   11.4   0   0   0    0
      361  335   71    5.4   0   0   0    1    (データ全体を見る

基礎統計量

                     平均値           不偏分散           標準偏差
売り上げ       296.19444444       1787.6799687       42.280964614
前年           277.29166667       1795.9278169       42.378388560
番号           35.500000000       438.00000000       20.928449536
気温           14.380555556       64.435109546       8.0271482823
2月          0.083333333333     0.077464788732      0.27832496965
4月          0.083333333333     0.077464788732      0.27832496965
7月          0.083333333333     0.077464788732      0.27832496965
12月         0.083333333333     0.077464788732      0.27832496965

相関係数行列

売り上げ  1.00000
前年      0.96665  1.00000
番号      0.81310  0.82879  1.00000
気温      0.42760  0.42712  0.06181  1.00000
2月      -0.27069 -0.23972 -0.06529 -0.40462  1.00000
4月      -0.01696 -0.04866 -0.03627 -0.05222 -0.09091  1.00000
7月       0.49291  0.47675  0.00725  0.40357 -0.09091 -0.09091  1.00000
12月      0.09316  0.09344  0.07979 -0.32519 -0.09091 -0.09091 -0.09091  1.00000
         売り上げ     前年     番号     気温      2月      4月      7月     12月

1.「前年」データに基づく予測

重回帰式

             偏回帰係数       標準誤差         t値       P値   標準化偏回帰係数
前年          0.9644269     0.03053996   31.5791788    0.00000      0.9666491
定数項         28.76690       8.565447    3.3584827    0.00127
                                              t値の自由度: 70
              トレランス     分散拡大係数
 前年           1.000000         1.000000

分散分析表

要因            平方和    自由度       平均平方           F値      P値
回帰          118600.3         1       118600.3       997.2445    0.00000
残差          8324.961        70       118.9280
全体          126925.3        71
重相関係数:                     0.96665
決定係数(重相関係数の二乗):   0.93441
自由度調整済み重相関係数の二乗: 0.93347

従属変数の観察値,予測値および標準化残差

ケース         観察値         予測値           残差     標準化残差
     1       226.0000       212.9724       13.02756       1.239721
     2       212.0000       224.5456      -12.54556      -1.184387
     3       231.0000       219.7234       11.27657       1.067952
     4       249.0000       232.2610       16.73902       1.573044
     5       251.0000       241.9052       9.094753      0.8504531
     6       243.0000       247.6918      -4.691809     -0.4376086
     7       313.0000       311.3440       1.656016      0.1530665
     8       255.0000       268.9092      -13.90920      -1.288441
     9       268.0000       258.3005       9.699495      0.9011338
    10       244.0000       256.3717      -12.37165      -1.150127
    11       229.0000       252.5139      -23.51394      -2.188982
    12       262.0000       267.9448      -5.944773     -0.5508031
    13       237.0000       246.7274      -9.727382     -0.9076492
       途中省略
    71       336.0000       345.0989      -9.098925     -0.8488065
    72       361.0000       351.8499       9.150087      0.8561836

予測値と標準化残差
・

予測値と実測値
・


2.時系列番号による予測

重回帰式

             偏回帰係数       標準誤差         t値       P値   標準化偏回帰係数
番号           1.642678      0.1405637   11.6863625    0.00000      0.8131012
定数項         237.8794       5.782221   41.1397964    0.00000
                                              t値の自由度: 70
              トレランス     分散拡大係数
 番号           1.000000         1.000000

分散分析表

要因            平方和    自由度       平均平方           F値      P値
回帰          83914.56         1       83914.56       136.5711    0.00000
残差          43010.72        70       614.4388
全体          126925.3        71
重相関係数:                     0.81310
決定係数(重相関係数の二乗):   0.66113
自由度調整済み重相関係数の二乗: 0.65629

従属変数の観察値,予測値および標準化残差

ケース         観察値         予測値           残差     標準化残差
     1       226.0000       237.8794      -11.87938     -0.4926909
     2       212.0000       239.5221      -27.52205      -1.140126
     3       231.0000       241.1647      -10.16473     -0.4206054
     4       249.0000       242.8074       6.192590      0.2559609
     5       251.0000       244.4501       6.549912      0.2704424
     6       243.0000       246.0928      -3.092766     -0.1275674
     7       313.0000       247.7354       65.26456       2.689295
     8       255.0000       249.3781       5.621878      0.2314335
     9       268.0000       251.0208       16.97920      0.6983303
    10       244.0000       252.6635      -8.663478     -0.3559999
    11       229.0000       254.3062      -25.30616      -1.038993
    12       262.0000       255.9488       6.051166      0.2482385
    13       237.0000       257.5915      -20.59151     -0.8440668
       途中省略
    71       336.0000       352.8668      -16.86683     -0.6987241
    72       361.0000       354.5095       6.490487      0.2691896

予測値と標準化残差
・

予測値と実測値
・


3.時系列番号および各月のダミー変数による予測

重回帰式

             偏回帰係数       標準誤差         t値       P値   標準化偏回帰係数
番号           1.607140     0.06416153   25.0483481    0.00000      0.7955106
2月           -25.06698       4.881339    5.1352667    0.00000     -0.1650096
4月            7.052076       4.875221    1.4465143    0.15277     0.04642205
7月            73.23066       4.872370   15.0297818    0.00000      0.4820590
12月           9.528288       4.884500    1.9507191    0.05534     0.06272233
定数項         233.7456       2.803994   83.3616574    0.00000
                                              t値の自由度: 66
              トレランス     分散拡大係数
 番号          0.9889784         1.011144
 2月           0.9661133         1.035075
 4月           0.9685396         1.032482
 7月           0.9696733         1.031275
 12月          0.9648630         1.036417

分散分析表

要因            平方和    自由度       平均平方           F値      P値
回帰          118569.0         5       23713.80       187.2977    0.00000
残差          8356.272        66       126.6102
全体          126925.3        71
重相関係数:                     0.96652
決定係数(重相関係数の二乗):   0.93416
自由度調整済み重相関係数の二乗: 0.92918

従属変数の観察値,予測値および標準化残差

ケース         観察値         予測値           残差     標準化残差
     1       226.0000       233.7456      -7.745629     -0.7105407
     2       212.0000       210.2858       1.714207      0.1696291
     3       231.0000       236.9599      -5.959909     -0.5454399
     4       249.0000       245.6191       3.380874      0.3345538
     5       251.0000       240.1742       10.82581      0.9885674
     6       243.0000       241.7813       1.218670      0.1111668
     7       313.0000       316.6191      -3.619126     -0.3581300
     8       255.0000       244.9956       10.00439      0.9107767
     9       268.0000       246.6028       21.39725       1.946116
    10       244.0000       248.2099      -4.209891     -0.3825484
    11       229.0000       249.8170      -20.81703      -1.889967
    12       262.0000       260.9525       1.047541      0.1036592
    13       237.0000       253.0313      -16.03131      -1.453082
       途中省略
    71       336.0000       346.2454      -10.24545     -0.9384583
    72       361.0000       357.3809       3.619126      0.3581300

予測値と標準化残差
・

予測値と実測値
・


4.時系列番号と各月のダミー変数および平均気温による予測

重回帰式

             偏回帰係数       標準誤差         t値       P値   標準化偏回帰係数
番号           1.579449     0.04531485   34.8550003    0.00000      0.7818038
気温           1.267407      0.1536436    8.2490058    0.00000      0.2406203
2月           -10.05218       3.890137    2.5840168    0.01202    -0.06617098
4月            10.31425       3.456420    2.9840848    0.00400     0.06789612
7月            61.30365       3.723870   16.4623506    0.00000      0.4035466
12月           22.15844       3.765592    5.8844515    0.00000      0.1458635
定数項         214.9210       3.017953   71.2141641    0.00000
                                              t値の自由度: 65
              トレランス     分散拡大係数
 番号          0.9835511         1.016724
 気温          0.5815684         1.719488
 2月           0.7546019         1.325202
 4月           0.9558609         1.046177
 7月           0.8234907         1.214343
 12月          0.8053437         1.241706

分散分析表

要因            平方和    自由度       平均平方           F値      P値
回帰          122842.8         6       20473.80       325.9778    0.00000
残差          4082.477        65       62.80734
全体          126925.3        71
重相関係数:                     0.98379
決定係数(重相関係数の二乗):   0.96784
自由度調整済み重相関係数の二乗: 0.96487

従属変数の観察値,予測値および標準化残差

ケース         観察値         予測値           残差     標準化残差
     1       226.0000       219.1034       6.896579      0.9228958
     2       212.0000       211.0109      0.9890886      0.1389741
     3       231.0000       226.5715       4.428499      0.5831816
     4       249.0000       246.8301       2.169916      0.3049300
     5       251.0000       243.2916       7.708351       1.000578
     6       243.0000       249.0535      -6.053540     -0.7891089
     7       313.0000       317.3865      -4.386492     -0.6163395
     8       255.0000       259.9436      -4.943618     -0.6570108
     9       268.0000       256.0732       11.92678       1.557117
    10       244.0000       249.4145      -5.414525     -0.6986844
    11       229.0000       244.6569      -15.65694      -2.024736
    12       262.0000       262.1845     -0.1845406    -0.02593298
    13       237.0000       238.4370      -1.437031     -0.1898500
       途中省略
    71       336.0000       339.9308      -3.930847     -0.5137266
    72       361.0000       356.0643       4.935701      0.6936217

予測値と標準化残差
・

予測値と実測値
・


まとめ

以下の4つの重回帰モデルを作った。
モデル 決定係数
「前年」データに基づく予測 0.93441
時系列番号による予測 0.66113
時系列番号および各月のダミー変数による予測 0.93416
時系列番号と各月のダミー変数および平均気温による予測 0.96784

・ 重回帰分析の最初のページへ戻る
・ E-mail to Shigenobu AOKI