No.08654 Multiple Regression Analysis  【MoMo】 2008/12/16(Tue) 15:24

お世話になります。
Multiple Regression Analysisをおこなっている論文で説明変数を15も20も投入して検討しているものがあります。説明変数どうしの相関が仮にないとしても,多すぎて 統計的に正しいのかどうか疑問を持ちます。かといって,読者が特定の変数との関連に注目している場合も多いですから,stepwise法で変数を絞ること に完全に依存できない側面もあると思います。この点について御教授いただければ幸いです。私自身は根拠はないのですが,説明変数が10を越える場合には stepwise法を用いるようにしています。

No.08713 Re: Multiple Regression Analysis  【sb】 2008/12/21(Sun) 15:54

> 説明変数が,,,,多すぎて統計的に正しいのかどうか疑問を持ちます。

一般的には, MoMoさんのおっしゃる通りでしょう。しかし,モデルの適合度のよさを多少犠牲にしても,敢て説明変数を多く入れる場合があります。臨床疫学では,既知 の交絡因子で調整しても,なお曝露が疾病と有意な関連がある,と云う方法論をとります。既知の交絡因子1個づつは,疾病とさほど大きな関連は無くとも,そ の影響は調整してありますよと主張できる様に,モデルを構築するわけです。従って,他の分野に比べて,説明変数の数が多い傾向にありますが,それはそれ で,合理的だと私は思います。

No.08843 Re: Multiple Regression Analysis  【MoMo】 2009/01/07(Wed) 19:06

sb先生,ありがとうございます。

よくわかりました。
特に臨床研究においては,読者を説得出来得る良識ある統計処理をおこなうことが大事なんだな,と最近よく思います。
そのためにも医者もきちんと統計を学ぶべきなんでしょうね。

今後ともよろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る