★ 標準偏回帰係数について ★

1134. 標準偏回帰係数について 渡邉 2003/11/26 (水) 21:23
└1142. Re: 標準偏回帰係数について 青木繁伸 2003/11/27 (木) 11:22
 └1151. Re^2: 標準偏回帰係数について 渡邉 2003/11/27 (木) 23:48
  └1153. Re^3: 標準偏回帰係数について 青木繁伸 2003/11/28 (金) 09:43
   └1162. Re^4: 標準偏回帰係数について 渡邉 2003/11/28 (金) 18:43
    └1164. Re^5: 標準偏回帰係数について 青木繁伸 2003/11/28 (金) 22:24


1134. 標準偏回帰係数について 渡邉  2003/11/26 (水) 21:23
こんばんわ。はじめてお世話になります。現在,重回帰分析をしています。そこで2,3質問ですがお答えいただけますか?
まず単回帰分析を行ったのですが,(n=76)有意でないとなった説明変数があります,しかし重回帰分析(ステップワイズ法)にて分析するとそれが選択され,その中で選ばれた変数のなかで標準偏回帰係数が一番大きくなっているのです。どういうことか教えてほしいのですが・・。また符号の逆転(マルチコ)はありません。

     [このページのトップへ]


1142. Re: 標準偏回帰係数について 青木繁伸  2003/11/27 (木) 11:22
単回帰分析の積み上げが重回帰分析ではないということでしょう。
同時に使用する独立変数との関係からそうなるとしかいえません。

     [このページのトップへ]


1151. Re^2: 標準偏回帰係数について 渡邉  2003/11/27 (木) 23:48
> 単回帰分析の積み上げが重回帰分析ではないということでしょう。
> 同時に使用する独立変数との関係からそうなるとしかいえません。
お答えありがとうございます。たびたびで悪いのですが前回の質問に追加して質問したいのですが,お答えおねがいします。標準偏回帰係数が1以上でその説明変数は,他の説明変数との相関が0.8となっていますがやはり多重共線性があるのでしょうか。あと標準偏回帰係数が1以上をとることがあるのでしょうか?お答えおねがいします。

     [このページのトップへ]


1153. Re^3: 標準偏回帰係数について 青木繁伸  2003/11/28 (金) 09:43
> 標準偏回帰係数が1以上でその説明変数は,他の説明変数との相関が0.8となっていますがやはり多重共線性があるのでしょうか。あと標準偏回帰係数が1以上をとることがあるのでしょうか?

多重共線性も,二つの独立変数の相関係数だけで決まるものではなく,また相関係数がどれくらい大きいときに多重共線性があると決定できるものではありません。

初回の質問では「符号の逆転(マルチコ)はない」と書かれていましたが,符号の逆転は多重共線性の重大な現れですが,そこまで行かなくても多重共線性は存在します。ステップワイズ変数選択をした場合には多重共線性のある独立変数は除外されることが多いですが,Fin/Fout(Pin/Pout)の設定が不適切な場合には,多重共線性が残るかもしれません。

標準化偏回帰係数が1以上の値を取ると言う件については,過去ログを見てください。多重共線性の証拠と考えられる事が多いようです。対処例も書いてあるので,是非参照してください。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc017/017.html

多重共線性があるかないかは,各独立変数のトレランスを計算する必要があります。また,このトレランスの値も基準があるわけではなく,相対的に考える必要が出てくることもあります。

# データをメールで送っていただくと,はっきりしたことがわかるかもしれません。

     [このページのトップへ]


1162. Re^4: 標準偏回帰係数について 渡邉  2003/11/28 (金) 18:43
お答えありがとうございます。とても勉強になりました。よろしければデータを見ていただきたいのですが,送り先はどうしたらよいのでしょうか?よろしくおねがいします。

     [このページのトップへ]


1164. Re^5: 標準偏回帰係数について 青木繁伸  2003/11/28 (金) 22:24
検討結果は,変数名を伏せて,以下の通り。
# 相関係数行列を入力(原データがなかったので)
> r <- matrix(c(1, 0.078682685, -0.480694494, 0.089961179, -0.252206723, -0.064758542,
+ 0.078682685, 1, 0.156187366, -0.073770017, 0.099503583, 0.222291599,
+ -0.480694494, 0.156187366, 1, -0.206075698, 0.255382163, 0.288889057,
+ 0.089961179, -0.073770017, -0.206075698, 1, -0.843781252, -0.319269629,
+ -0.252206723, 0.099503583, 0.255382163, -0.843781252, 1, 0.193902418,
+ -0.064758542, 0.222291599, 0.288889057, -0.319269629, 0.193902418, 1), nrow=6)

# トレランスを計算する関数(簡単です)
> tolerance <- function(x)
+ {
+     t <-1/diag(solve(x))    # 相関係数行列の逆行列の対角成分の逆数
+     names(t) <- paste("Var", 1:ncol(x), sep="")    # 要素に名前を付けているだけ
+     t    # 関数が返す値
+ }

結果です
> tolerance(r)
     Var1      Var2      Var3      Var4      Var5      Var6 
0.6738378 0.8975985 0.6753197 0.2422060 0.2437913 0.7830072 
Var4, Var5 の二つのトレランスが低すぎます。標準化偏回帰係数が高いのもこの二つですね。ところで,この分析結果は,変数選択によるものでしょうか?質問されたときには変数選択を行ったように書いてあった?(読んだ?)のですが,そうではないのでしょうね。
ステップワイズ変数選択をすると,この様なことは起こらないと思うのです。

Var4 か Var5 の,いずれかを取り除いて再分析してみてください。

この両変数間の相関が -0.843781252 ですから,やはり,高すぎますね。
単相関係数と偏回帰係数の符号の一致だけでは,安心するわけには行きません(多重共線性を否定することはできません)。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 026 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る