No.15466 回帰分析における説明変数の二乗  【一進一退】 2011/10/10(Mon) 17:01

この掲示板の
8040. 説明変数を2乗するのはどうしてですか? しげ  2005/10/21 (金) 02:35
のスレッドを見せていただいたのですが,こういう「2乗」した変数を入れるという手法は,どこかの分野ではよく用いられている方法なのでしょうか。

理 屈としては,説明変数xが直線的に関連するのではなく,最初は低く,中間で高く,最後に低くなる=年齢(20代から60代以降まで)と現金収入のような場 合に年齢を二乗してやればうまくフィットするだろうということはあると思いますし,さらに,それを傾けたような形,たとえば,最初は低く,中間で高くなっ て,その後は伸びが低くなるような場合に,元の説明変数と二乗した説明変数とで説明すれば,うまくいくような気がします。

しかし,二乗しているとはいえ,元の変数が正の値しかとらないような場合は,相関係数は非常に高くなります。
こういう場合は多重共線性の問題は考えなくてもいいのでしょうか。
いくつか,自分で数値例を作ってやってみましたが,VIFが300なんて,見たことのない数値が出てきました。

No.15467 Re: 回帰分析における説明変数の二乗  【青木繁伸】 2011/10/10(Mon) 18:09

> 二乗しているとはいえ,元の変数が正の値しかとらないような場合は,相関係数は非常に高くなります。
> いくつか,自分で数値例を作ってやってみましたが,VIFが300なんて,見たことのない数値が出てきました。

まず,前提として,なんの理論根拠もなくやるものではないです。

例えば,円の半径に比例するのではなく面積に比例するのだという場合,半径を独立変数にするのではなく半径の二乗(×π)を独立変数にするのは,「どんな分野においても」妥当至極な話でしょう。

> どこかの分野ではよく用いられている方法なのでしょうか

まさに,固有科学の問題です。
二乗するのが良いか悪いかという単純至極な問題ではありません。

なお,

> 最初は低く,中間で高く,最後に低くなる=年齢(20代から60代以降まで)と現金収入のような場合に年齢を二乗してやればうまくフィットするだろうということはあると思いますし

というのは,放物線の変域についての問題であって,変域のどの部分を使うかということ(これも固有科学に属することなので,一般論は不適切)。

No.15469 Re: 回帰分析における説明変数の二乗  【一進一退】 2011/10/10(Mon) 20:04

ご返信ありがとうございます。
ご指摘の点はそのとおりだと思うのですが,半径の二乗というような明確なものならわかるのですが,
理論で二乗すべしというよりは,「カーブしてるようだから二乗で合わせればOKじゃん」というような話です。

とあるところで,年齢,年齢の二乗,その他いくつかの独立変数を用いた重回帰分析をしている研究があり,
その分析をした本人たち(二人)に,二乗の項を入れた理由をたずねたのですが,その回答が
「二乗項を入れたら係数が負だったから,年齢が上がれば頭打ちになると判断した」というように聞こえ,
「二乗項を入れた理由」を尋ねたのに,「二乗項の係数が意味するもの」を答えられました。
また,多重共線性の問題もあるかと思いますが,相関やVIFの報告もなされていないので,
その分野ではそういうやり方が当然であって,尋ねる方がおかしいのかな,と思いまして。(私は初めて見たものですから。)

言葉足らずの質問にお答えくださりありがとうございます。
本人たちにもう一度詳しく聞いてみます。

No.15472 Re: 回帰分析における説明変数の二乗  【青木繁伸】 2011/10/10(Mon) 21:25

> 「カーブしてるようだから二乗で合わせればOKじゃん」というような話

ナニイッテンデショウネエと,鼻で笑えば良いだけです。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る