No.14277 重回帰でのダミー変数同士の交互作用項  【文系分野人】 2011/02/02(Wed) 20:40

このHPで以前から勉強させていただいております。
「重回帰でのダミー変数同士の交互作用項」の作成とセンタリング(中心化)について,明確に書かれた文献が見つからず,悩んでおります。
すみませんがよろしくお願いいたします。

「重 回帰モデルへ投入する変数と変数の積で構成する交互作用項は相関が高いため,多重共線性によりモデルが適切に推定されない。交互作用項を構成する各変数の 平均値を差し引くこと(センタリング,中心化)でこれを抑制できる(Aiken & West, 1991)」

とあります。

(1)しかし,重回帰分析で,どうしてもダミー変数同士の交互作用項を作成する必要がある場合,それぞれのダミー変数は,ダミー変数なので,センタリング(中心化)する必要がない,もしくはしてはいけない,と考えてよいのでしょうか?
  ・ダミー変数A(0,1)
  ・ダミー変数B(0,1)
このようなダミー変数を,単純にかけ合わせて使用してよいのでしょうか?
知り合いの研究者には,ダミー変数なのでセンタリング(中心化)しないでかけ合わせるはずだ,と助言をいただいております。

(2)重回帰分析で,ダミー変数(0,1)と量的変数(例えば0点〜10点)との交互作用項を作成する場合です。ダミー変数はセンタリング(中心化)しないとし,量的変数のみセンタリング(中心化)して,交互作用項を作成するのでしょうか?
そのような原著論文をみたことがあります。

(3)上記の(1)と(2)は,二項ロジスティック回帰において交互作用項を作成する場合も同じでしょうか?

すみませんが,お教え下さいますようよろしくお願いいたします。

No.14278 Re: 重回帰でのダミー変数同士の交互作用項  【青木繁伸】 2011/02/03(Thu) 17:42

ダミー変数の場合であっても,センタリングが有効なことが多いようです
library(MASS)
n <- 100
d <- mvrnorm(n, mu=rep(0, 3), Sigma=diag(3))
x1 <- (d[,1] < 0.1)+0
x2 <- (d[,2] < 0.5)+0
y <- (d[,3] < -0.2)+0
x12 <- x1*x2
x12c <- (x1-mean(x1))*(x2-mean(x2))
X <- cbind(x1, x2, x12, x12c, y)
round(cor(X), 5 )
diag(solve(cor(cbind(x1, x2, x12)))) # VIF
diag(solve(cor(cbind(x1, x2, x12c)))) # VIF
実行結果
> round(cor(X), 5 )
x1 x2 x12 x12c y
x1 1.00000 -0.07790 0.72326 0.01584 -0.02639
x2 -0.07790 1.00000 0.47396 0.08626 0.00829
x12 0.72326 0.47396 1.00000 0.49680 0.00952
x12c 0.01584 0.08626 0.49680 1.00000 0.05732
y -0.02639 0.00829 0.00952 0.05732 1.00000
> diag(solve(cor(cbind(x1, x2, x12)))) # VIF
x1 x2 x12
4.021875 2.473714 5.155589
> diag(solve(cor(cbind(x1, x2, x12c)))) # VIF
x1 x2 x12c
1.006626 1.013917 1.008016
> 二項ロジスティック回帰において交互作用項を作成する場合も同じでしょうか?

同じでしょうね

No.14284 Re: 重回帰でのダミー変数同士の交互作用項  【文系分野人】 2011/02/08(Tue) 07:43

青木先生,ご返答感謝いたします。
「ダミー変数の場合であっても,センタリングが有効なことが多い様子」とのことで,ダミー変数の場合に中心化すべきかどうか,ますます考え込んでしまいます。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る