★ 重回帰分析の変数を重み付け ★

 95 重回帰分析の変数を重み付け  山鹿 始  2000/03/04 (土) 20:46
  96 Re: 重回帰分析の変数を重み付け  マンボウ  2000/03/04 (土) 21:12
   98 Re^2: 重回帰分析の変数を重み付け  山鹿 始  2000/03/05 (日) 08:53
    99 Re^3: 重回帰分析の変数を重み付け  マンボウ  2000/03/05 (日) 19:34
     116 Re^4: 重回帰分析の変数を重み付け  山鹿 始  2000/03/09 (木) 22:16
      117 Re^5: 重回帰分析の変数を重み付け  青木繁伸  2000/03/10 (金) 10:30


95. 重回帰分析の変数を重み付け  山鹿 始  2000/03/04 (土) 20:46
重回帰分析で,y = a1x1+a2x2+...+anxnでは都合が悪いというので,各変数に重みを付けて,合成変数をXi=p1x1+p2x2+..pjxj(piは変数相互の相関係数から設定した重み)のように設定し,y=A1X1+A2X2+...+AmXmのようにして分析している例(ある有名な研究所の報告書)がありました。

これだと,元の変数をそれぞれ何倍かした数値を変数として重回帰分析しただけに過ぎないと思うのですが,意味があることなのでしょうか?

y=a1x1+a2x2が,y=a1'(p1x1)+a2'(p2x2)になったからといって,モデルの信憑性は変わらないと思いますが。どうなのでしょう。

     [このページのトップへ]


96. Re: 重回帰分析の変数を重み付け  マンボウ  2000/03/04 (土) 21:12
何処の研究所のどのような報告書なのか,明示すればいいと思いますけど。

テストデータを使ってやってみたところ,もとのデータを使うのとはかなり異なった結果も出るようですね。

Xi=p1x1+p2x2+..pjxj をいい加減に作ると,元のデータを使った場合より,「遙かに悪い結果」が得られることもあります。

Xiとして,ある種の意味を持たせた総合特性値的なものをつくって,それを使って予測するというのが説明しやすいこともあるかもしれませんね。

やはり,その報告書をちゃんと見てからでないと,正確な評価はできないかもしれません。

     [このページのトップへ]


98. Re^2: 重回帰分析の変数を重み付け  山鹿 始  2000/03/05 (日) 08:53
コメントありがとうございます。
以下のような例で,困っています。

(あるエリア内の)
y:平均地価単価
x1:飲食店の床面積
x2:物販店の床面積
x3:サービス業の床面積
x4:業務施設の床面積
x5..xn:様々な変数

x1からx3までの相関が高いことは想像できます。
物販店が多いところは,普通,飲食店も多いからです。

ここで相関行列を使って,
X=1.0*x1+0.7*x2+0.6*x3として,新たな変数(商業施設変数)を導入し,
y = A*X + a4*x4+..+an*xnとして重回帰をします。

これで,多重共線性を回避したと言えるのかどうかが,悩んでいるところなのです。

     [このページのトップへ]


99. Re^3: 重回帰分析の変数を重み付け  マンボウ  2000/03/05 (日) 19:34
> ここで相関行列を使って,
> X=1.0*x1+0.7*x2+0.6*x3として,新たな変数(商業施設変数)を導入し,

というところがよくわからないのですが?
x1,x2,x3 からどういう手法を使ってXを作りますか?

主成分分析で主成分得点を作るとか。

そういうことなら,問題ないのではないですか?

     [このページのトップへ]


116. Re^4: 重回帰分析の変数を重み付け  山鹿 始  2000/03/09 (木) 22:16
> そういうことなら,問題ないのではないですか?

う〜ん,ちょっと混乱してきた。
例えば,
x1:男性夜間人口
x2:女性夜間人口
x3:事業所数
y:税収
とした時,
(1)y=aX+bx3+c, X=x1+c×x2
  (c は,重回帰の結果がなるだけ良くなるように設定)
(2)y=αx1+βx2+γx3+δ

合成関数Xを使う(1)の例は,結局合成関数を利用しない(2)と同じことではないでしょうか。

     [このページのトップへ]


117. Re^5: 重回帰分析の変数を重み付け  青木繁伸  2000/03/10 (金) 10:30
> > そういうことなら,問題ないのではないですか?
>
> う〜ん,ちょっと混乱してきた。
> 例えば,
> x1:男性夜間人口
> x2:女性夜間人口
> x3:事業所数
> y:税収
> とした時,
> (1)y=aX+bx3+c, X=x1+c×x2
>   (c は,重回帰の結果がなるだけ良くなるように設定)
> (2)y=αx1+βx2+γx3+δ
>
> 合成関数Xを使う(1)の例は,結局合成関数を利用しない(2)と同じことではないでしょうか。

X はどのようにきめるのかと,逆質問されていたのではないでしょうか?
実際にテストデータ(適当なデータ)を作って,同じになるかどうか確かめてみてはいかがでしょ?

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 007 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る