No.17570 抑制変数かどうか。論文での記載方法  【はばな】 2012/10/26(Fri) 09:55

独学で統計を勉強している者です。いつもお世話になっています。

重回帰分析についてですが,目的変数との単相関係数が正であるのに,偏回帰係数が負であるという説明変数がでてきてしまい,論文にどのように書けばよいか困っており質問をさせていただきました。

青木先生のBlack-boxで重回帰分析を計算したところ以下になりました。X6が符号が逆転しております。過去のログ等で勉強したところ,相関やVIFを見るようにとのことで,X6を見たところ若干VIFは高いのですが,10以下です。

こ ういった場合,X5は多重共線性ではなく,抑制変数である可能性があるのかと考えたのですが,そう考えても問題ないでしょうか?また,この場合,論文に記 載する際,「説明がうまくできない理由は抑制変数だから」,,と書いても構わないのでしょうか?それとも,多重共線性を考えて,この変数は除外して計算を し直した方が良いのでしょうか?お忙しい中恐れ入りますが,よろしくお願いいたします。
    平均値           不偏分散           標準偏差
y -8.5868812061e-17 1.0050251256 1.0025094142
x1 5.9930625167 13.137030459 3.6245041674
x2 28.573999900 117.12423794 10.822395203
x3 14.890833618 43.929906593 6.6279639855
x4 23.739666700 10.005018830 3.1630711074
x5 17.735078550 3.1637024758 1.7786799813
x6 5.8480059750 1.1811313994 1.0867986931
x7 3.0572599015 0.39938052775 0.63196560646
x8 149.71249950 17.398401464 4.1711391087
x9 10.557778935 4.0575552535 2.0143374230
x10 1.1480523180 0.027032481823 0.16441557658
x11 0.51181654800 0.055294444002 0.23514770678
x12 13.634225210 3.4551515610 1.8588037984
***** 相関係数行列 *****

y 1.00000
x1 -0.49205 1.00000
x2 -0.23526 0.26882 1.00000
x3 0.24392 0.04467 0.06717 1.00000
x4 0.46443 -0.24693 -0.02838 0.11773 1.00000
x5 0.54365 -0.42135 -0.17817 0.09955 0.45867 1.00000
x6 -0.24270 0.28547 0.08023 -0.05878 -0.37505 -0.58541 1.00000
x7 0.26620 -0.15752 0.01555 0.10025 0.09816 0.17107 0.07989 1.00000
x8 -0.42605 0.33157 0.09177 0.11364 -0.22323 -0.21938 0.20534 0.01434
x9 0.24886 -0.09670 0.00169 0.05840 0.17526 0.14266 -0.02786 0.06015
x10 -0.47782 0.24961 0.17537 -0.01650 -0.18139 -0.16866 0.07874 -0.09852
x11 -0.44296 0.16136 0.00267 -0.12982 -0.12293 -0.23552 0.09357 -0.09679
x12 -0.61272 0.23031 0.02059 -0.19752 -0.23913 -0.20485 0.12854 -0.12062
y x1 x2 x3 x4 x5 x6 x7

x8 1.00000
x9 0.00706 1.00000
x10 0.21021 -0.13673 1.00000
x11 0.19269 -0.12525 0.28237 1.00000
x12 0.23725 -0.09805 0.31217 0.31017 1.00000
x8 x9 x10 x11 x12
従属変数: y
独立変数:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
***** 重回帰式 *****

偏回帰係数 標準誤差 t値 P値 標準化偏回帰係数
x1 -0.03694007 0.01165655 3.1690394 0.00179 -0.1335543
x2 -0.01085830 0.003452169 3.1453555 0.00193 -0.1172187
x3 0.02193078 0.005594351 3.9201645 0.00012 0.1449926
x4 0.04654116 0.01311781 3.5479382 0.00049 0.1468445
x5 0.1470925 0.02819027 5.2178456 0.00000 0.2609755
x6 0.1120623 0.04188566 2.6754334 0.00813 0.1214843
x7 0.1480720 0.05907342 2.5065757 0.01304 0.09334217
x8 -0.04539107 0.009440245 4.8082508 0.00000 -0.1888585
x9 0.04666092 0.01804652 2.5855912 0.01048 0.09375556
x10 -0.9826907 0.2387805 4.1154560 0.00006 -0.1611652
x11 -0.5615737 0.1654560 3.3940963 0.00084 -0.1317222
x12 -0.1734086 0.02156422 8.0414962 0.00000 -0.3215256
定数項 5.466347 1.536576 3.5574849 0.00047
t値の自由度: 187

トレランス 分散拡大要因
x1 0.6917360 1.445638
x2 0.8845995 1.130455
x3 0.8980859 1.113479
x4 0.7171952 1.394320
x5 0.4911154 2.036181
x6 0.5958662 1.678229
x7 0.8859446 1.128739
x8 0.7963459 1.255736
x9 0.9343862 1.070221
x10 0.8011134 1.248263
x11 0.8157009 1.225940
x12 0.7684988 1.301238
***** 分散分析表 *****

要因 平方和 自由度 平均平方 F値 P値
回帰 154.0514 12 12.83762 52.24607 0.00000
残差 45.94861 187 0.2457145
全体 200.0000 199
重相関係数: 0.87764
決定係数(重相関係数の二乗): 0.77026
自由度調整済み重相関係数の二乗: 0.75551

No.17572 Re: 抑制変数かどうか。論文での記載方法  【青木繁伸】 2012/10/26(Fri) 10:27

符号が違うのは x6 ですね?
確かに VIF も問題ないようで,またステップワイズ変数選択しても全ての独立変数は残るようです。
なお,「抑制変数」であるかどうかは,その変数の実態と他の変数との関連について理論とは行かなくても妥当な理由付け(解釈)ができるかどうかで判断すべきものです。

No.17574 Re: 抑制変数かどうか。論文での記載方法  【はばな】 2012/10/26(Fri) 11:04

さっそくご返答いただきありがとうございました。

x6でした。すみません。。

VIFからは問題ないとのことでご診断いただき,一つ安心いたしました。

ただ,変数の実態と変数の関連について,妥当な理由づけをしようとしてみたのですが,どのようにしても思いつきません。もし,妥当な理由づけができない場合には,論文で説明する際,どのように記載するのがよいのでしょうか。。

重ねての質問で申し訳ございません。どうぞよろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る