No.13734 多重共線性について  【MINTO】 2010/11/07(Sun) 12:03

前回は質問内容が不明確ですみませんでした。それにも関らず,返答ありがとうございます。
現在,多重共線性をリッジ回帰を使うことで,ある程度多重共線性の影響を回避できるということを示しているのですが,相関関係をある程度抑えつつ,データに線形関係を持たせた多重共線性があるデータを作りたいと考えています。例としては,
	X1  X2  X3	  X4   X5    Y
1.98786  1.0  0.30  2.01722  0.0  20.11371
1.94418  0.0  0.30  1.98786  0.1  15.10439
2.19954  0.8  0.35  1.94418  0.0  18.68375
2.00107  0.0  0.35  2.19954  0.8  16.05173
1.69292  1.3  0.30  2.00107  0.0  21.30101
1.74334  0.3  0.32  1.69292  1.3  17.850047
2.06907  1.0  0.31  1.74334  0.3  18.87558
1.01709  1.0  0.41  2.06907  1.0  21.26599
2.01906  0.9  0.45  1.10709  1.0  20.48473
 1.06139  1.0  0.45  2.01906  0.9  20.54032
 1.45999  1.5  0.50  1.06139  1.0  26.18441
 1.87511  0.0  0.60  1.45999  1.5  21.71606
 2.27109  0.8  0.65  1.87511  0.0  28.69595
 1.11191  1.0  0.65  2.27109  0.8  25.83720
 1.77407  1.2  0.65  1.11191  1.0  29.31987
このデータは,X1+X2+X4+X5=約5になるいという線形関係があり,また,相関関係も,
         X1          X2        X4        X5
X1 1.0000000 -0.3569539 -0.1359156 -0.5217700
X2 -0.3569539 1.0000000 -0.3192446 -0.1500205
X4  -0.1359156 -0.3192446 1.0000000 -0.3897101
X5  -0.5217700 -0.1500205 -0.3897101 1.0000000
となっています。このようなデータをRを使って,作りたいのですがどのようにすればいいのかが全くわかりません。長々とすみません。
どうかご教授おねがいします。

No.13735 Re: 多重共線性について  【青木繁伸】 2010/11/07(Sun) 12:23

No. 13723 に書かれているように,mvrnorm 関数を使えば,任意の相関係数行列を持つデータを作ることができます。

No.13736 Re: 多重共線性について  【MINTO】 2010/11/07(Sun) 13:01

返答ありがとうございます。mvrnorm関数を使って,相関係数行列はつくる事が出来たのですが,X1+X2+X4+X5=約5のような線形関係があるのかがわからないのですが。
データを使う上で,このデータにはこのような線形関係があるため,多重共線性が疑われますと説明したいので,どうしても線形関係を明確にしたいのです。
コマンドは以下のように入力しました。
x<-matrix(c(1.00,0.502,0.513,0.111,0.502,1.00,0.491,0.321,0.531,0.491,1.00,
0.213,0.111,0.321,0.213,1.00),4,4)
library(MASS)
z <- mvrnorm(n=30,mu=rep(0,4),Sigma=x,empirical=TRUE)
繰り返しすみません。 

ご教授おねがいします。

No.13737 Re: 多重共線性について  【青木繁伸】 2010/11/07(Sun) 13:25

X1+X2+X4+X5≒5 なら,まず,x1,x2,x4 のデータを作り(各変数の平均値と分散も設定してから),x5=x1+x2+x4 になるように x5 を作ればよいと思います。これでは完全に従属になるので,jitter 関数を使って x5 に若干の誤差を加えます。このやり方では当初指定した相関係数行列とずれてしまいますけど,乱数初期値を変えることなどで,希望する性質を持ったデータ行 列を作ることができると思います。

# 件のスレッドの後半を踏まえ,回答はこの程度にします。これ以降は,ご自分でお考えください。

No.13738 Re: 多重共線性について  【MINTO】 2010/11/07(Sun) 14:13

返答ありがとうございます。
アドバイスを基にどうにかできそうなのでやってみます。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る