No.21035 多重共線性への対応  【静かな改革者】 2014/05/06(Tue) 14:55

お世話になります。

1991年から2002年までの日本への観光旅行客数(Visitors)の増加を,ビザなし渡航許可国数(VISA)の増加と世界経済GDP(Economy)のの成長から説明する回帰モデルを考えます。標準化したデータを下に示します。データは架空のものです。

Year Visitors VISA Economy
1991 -1.411887772 -1.591088422 -1.526499438
1992 -1.268805506 -1.176664015 -1.499080727
1993 -1.087181714 -1.002598203 -1.078114244
1994 -0.845100626 -0.70769148 -0.546481046
1995 -0.37580087 -0.443375105 -0.1526659
1996 -0.15135316 -0.083786483 0.07494649
1997 0.140857102 0.289116583 0.152622775
1998 0.582195359 0.465541189 0.285921354
1999 0.981465415 0.490633163 0.671611798
2000 0.931588146 0.988527629 1.120773239
2001 1.176440193 1.296937828 1.287226119
2002 1.327583432 1.474447315 1.209739582

しかし,説明変数のVISAとEconomyには高い相関にあり,多重共線性があります。(なお,VISAEconomyの相関はあくまでも数理的な偶然の相関で,現実での因果関係はないと考えます。) 下に相関行列を示します。

Visitors VISA Economy
Visitors 1.0000000 0.9821997 0.9771683
VISA 0.9821997 1.0000000 0.9808716
Economy 0.9771683 0.9808716 1.0000000

この場合,重回帰分析はあきらめ,VISAとEconomyをそれぞれ説明変数とした単回帰を行って,結果を解釈するというのが,選択可能な方法となるのでしょうか。

ご教示いただければ幸いです。

実際に,回帰分析をした結果は次のようになります。

--------------------------
Call:
lm(formula = Visitors ~ VISA + Economy)

Residuals:
Min 1Q Median 3Q Max
-0.20362 -0.09740 -0.05542 0.04373 0.43045

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -9.167e-11 5.554e-02 0.000 1.000
VISA 6.261e-01 2.980e-01 2.101 0.065 .
Economy 3.631e-01 2.980e-01 1.218 0.254
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1924 on 9 degrees of freedom
Multiple R-squared: 0.9697, Adjusted R-squared: 0.963
F-statistic: 144.1 on 2 and 9 DF, p-value: 1.465e-07
---------------------------

--------------------------
Call:
lm(formula = Visitors ~ VISA)

Residuals:
Min 1Q Median 3Q Max
-0.15001 -0.11497 -0.08323 0.07600 0.49957

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.483e-12 5.687e-02 0.00 1
VISA 9.822e-01 5.940e-02 16.54 1.37e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.197 on 10 degrees of freedom
Multiple R-squared: 0.9647, Adjusted R-squared: 0.9612
F-statistic: 273.4 on 1 and 10 DF, p-value: 1.366e-08
-------------------------------

-------------------------------
Call:
lm(formula = Visitors ~ Economy)

Residuals:
Min 1Q Median 3Q Max
-0.31110 -0.17884 -0.02098 0.15811 0.32519

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.462e-10 6.433e-02 0.00 1
Economy 9.772e-01 6.719e-02 14.54 4.7e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2228 on 10 degrees of freedom
Multiple R-squared: 0.9549, Adjusted R-squared: 0.9503
F-statistic: 211.5 on 1 and 10 DF, p-value: 4.703e-08
-----------------------------------

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る