No.09057 影響量の調査  【れん】 2009/01/28(Wed) 00:10

初めて利用させて頂きます。

ある変数に対する影響力の強弱を調べたいのですが,なかなかうまくいきません。
分析方法や手順があっているかもわかっていない状態です。
手探りで少し頑張ってみましたが,不安なのでご指導お願いします。

ある量的変数Yと,そのYに影響を与えるであろう量的変数Xn(n=1〜10)があります。
Y と X1〜X10 の全11変数はそれぞれ550行のサンプルを持っています。
影響力の強弱を調べたいので以下の手順で重回帰分析を用いて分析しました。

手順1:説明変数間の相関を調べる。
手順2:目的変数Y 説明変数Xnと置き,Yを基準として特異値データを調べ,YとYに対応するXnを除く。
手順3:AICが低いもの,かつVIF10以上が無いもの,を基準に説明変数を選択する。
手順4:残差のテコ比(平均2.5倍以上)・t値(絶対値1.5以上)を()内を基準値として,ある程度削除する。
手順5:残差の自己相関を調べ,自己相関があったらコクラン・オーカット法で変数を再定義する。
手順6:残差の分散を調べ,均一で無かったらホワイトの修正を行い,回帰p値を設定し直す。
手順7:残差の正規性をチェックする。
手順8:手順1で説明変数間の相関を高くしているものを最低限除いたものの組み合わせで,手順2〜7を繰り返して幾つか重回帰モデルを得る。
手順9:得られた幾つかの重回帰モデルから重回帰有意Pの最も低いものを選ぶ。
手順10:選らんだ重回帰モデルの回帰p値(0.01以下)と標準偏回帰係数(高いもの)から影響力(要因?)の高い変数を予測する。

以上の様な手順で影響力調査を行っています。
得られた重回帰の自由度調整済みRが0.1などで,信用出来ない気がしますし,手順,分析方法もあっているか分からないです。
また手元にあるデータ(説明変数)は増えることは無いので,説明に必要な変数を追加して考える事も出来ないです。

目的変数や説明変数の形の対数・二乗値・逆数をとって考えてみる事もある…と何かで見た事があるのですが,元データの形を変えてしまっても良いのでしょうか。

長くなりましたが以上です。分かりづらい説明で申し訳ありませんが,何らかの助言を頂けたら幸いです。
よろしくお願いします。

No.09058 Re: 影響量の調査  【青木繁伸】 2009/01/28(Wed) 11:16

手順的には問題ないというか,教科書的で完璧かと思いますが。

> 得られた重回帰の自由度調整済みRが0.1などで,信用出来ない気がしますし

550近いサンプルサイズで,統計学的には有意になっているのでしょうが,残念ながら,実質的に意味がある結果とはいえないような感じですね。

> 目的変数や説明変数の形の対数・二乗値・逆数をとって考えてみる事もある…と何かで見た事があるのですが,元データの形を変えてしまっても良いのでしょうか。

理論的根拠のない変数変換などは不適切でしょうね。

No.09063 Re: 影響量の調査  【れん】 2009/01/28(Wed) 21:50

ご返信ありがとうございます。
分析過程が正しい事が分かっただけでも自信になりました。

同様の影響量の調査で,さらに考えてみたので聞いてください。

例えば,以下の重回帰モデルがあるとします。
目的変数:Y,説明変数:Xn(n = 1〜11),サイズ共に550,R2**:0.90,重回帰有意F:0。
上記モデルの説明変数 X2 の回帰P値が0.0001程度の場合,X2 は Y に対して影響があると言えないでしょうか。

上記モデルの説明変数:X11 は目的変数を多少変えた程度のデータで,当然 X11 を含んだ重回帰式はR2**が高くなります。
その上で他の説明変数の回帰P値(例えば X2)を見て,0.01有意であれば,その X2 は影響力があると言えないでしょうか。

以上です。ご返信頂ければ幸いです。
よろしくお願いします。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る