No.08838 多変量解析で検討する因子の選択方法について  【Suzuki】 2009/01/07(Wed) 14:10

 Cox比例ハザードモデルやロジスティック解析などで多変量解析するための因子の選択方法についてお聞きします。
  単変量解析で有意差があるものや0.1未満のものを多変量解析したとよく論文に書いてありますが,有意差があるものや0.1未満のものは全て多変量解析を しなければならないのでしょうか?というのも,例えば「手術後の長期予後に影響を与える因子をCox比例ハザードモデルで求める」という検討をするため に,年齢,クレアチン,心拍出量を単変量解析をしたところすべて有意差がでたため,すべての因子を多変量解析をし,年齢のみが独立予後予測因子であった。 ということを言うのは理解できるのですが,単変量解析を山のようにやって,年齢,クレアチン,心拍出量のほかに,高血圧の薬を飲んでいる,BMIが大き い,メタボリックシンドロームである,eGFR<60未満(説明は下)などにも単変量解析で有意差がでた場合,全て入れると多変量解析に有意差がな くなってしまうことや,クレアチンとeGFRは意味は一緒のため相互作用が強すぎて,検定できないといったことが起こります。そういう場合は独立予後予測 因子はわからないという結果になるのか,それとも腎機能としてはクレアチンではなくeGFRのみを検定に用いるなど,自分で多変量解析を行なう因子を決定 していいのかわかりません。
 統計ソフトにはステップワイズ変数選択法などがありましたが,ある文献では時に誤差がでるから使うべきでないなど, どんどん分からなくなってきました。さらに,「eGFR値とCre値どちらが長期予後に影響を与えるかCox比例ハザードモデルで求めるという検定をする のにたくさんの因子がありながら,eGFR値とCreの二つを選び,単変量解析で有意差があればそれを多変量解析していいのでしょうか。この時,多変量解 析を行うのはこの二つのみです。他の因子は単変量解析も行いません。

eGFR (ml/分/1.73 ) = 194×クレアチン^-1.094×年齢^-0.287 (男性)
          = 194×クレアチン^-1.094×年齢^-0.287×0.739 (女性)
eGFRとはクレアチンと年齢から求める推算尿細管濾過量のこと

 結局,多変量解析は検討項目が少なければ少ないほど有意差がでやすいと思うのです。自分で因子を決定してよければ有意差はでるのですが…。もしお時間があれば是非ご教授していただければ幸甚です。

No.08839 Re: 多変量解析で検討する因子の選択方法について  【青木繁伸】 2009/01/07(Wed) 14:35

> 結局,多変量解析は検討項目が少なければ少ないほど有意差がでやすいと思うのです

「有意差が出る」って,どういうことですか?(有意な結果が出るというのならまだわかる。何との差なのですかね?)

それはともかく,原則は,単変量解析の結果有意なものだけを使って最終的な多変量解析を行うというのは,間違いだと言うことです。

単変量解析では無関係なものも重要な変数であることもある。同じような性質を持つ変数は単変量では共に意味のある変数になるのは当たり前だが,最終的なモデルに両方の変数を共に取り入れるのは大問題。

> ステップワイズ変数選択法などがありましたが,ある文献では時に誤差がでるから使うべきでない

「誤差が出る」というのも,訳のわからない記述ですね。

ステップワイズ変数選択は,因果関係やモデルの理論的な適切性は一切考慮されないので,不適切な結果が得られることもあるということに過ぎないわけでしょう。

基本的に,先行研究による知見などを参考にして,理論的に,適切に決める必要があるというだけでしょう。結果として取り上げた変数(モデル)が妥当であるかどうかは,第三者が評価してくれる。不適切なモデルを提案したら,その研究者の評価が低くなるだけのこと。

No.08840 Re: 多変量解析で検討する因子の選択方法について  【Suzuki】 2009/01/07(Wed) 15:46

 早速のご回答誠にありがとうございます。「有意差が出る」は間違いです。「有意な結果が出る」に変えます。「誤差」も「不適切な結果が得られることもある」に変えます。

 いろいろご指摘ありがとうございます。文章は統計初心者のため少しおかしくなっております。大変申し訳ございません。

 先行研究による知見などを参考に,論理的に,適切に決める必要があるということですね。これからも統計学を勉強し取り上げた変数が妥当であるか分かるようになるよう努力します。

 ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る