No.22243 交絡因子の取り扱い  【小林】 2016/12/21(Wed) 10:14

青木先生

度々のご質問で申し訳ございません。
小林と申します。重回帰分析の質問に対して,ご丁寧にご説明して頂きまして,御礼申し上げます。
交絡因子の取り扱いについてご教授をお願い申し上げます。

交絡因子となる要因をサンプルから除外して解析する場合と,サンプルから除外しないで多変量解析時に説明因子に組み込んで解析する場合とでは結果は同じになるという認識で良いのでしょうか?

具体的には,脳卒中患者に投与している薬剤Aが脳卒中患者の認知機能を低下させているかも知れないという仮説を立証する場合に,
母数(脳卒中患者)から認知症を合併している患者を除外する場合と
認知症合併患者を除外せず,多変量解析時に認知症合併患者を説明因子として組み込む場合とでは,結果は同じになりますでしょうか?

基本的なご質問で誠に恐縮でございますが,ご教授頂ければ幸いです。
何卒,宜しくお願い申し上げます。

No.22244 Re: 交絡因子の取り扱い  【青木繁伸】 2016/12/21(Wed) 12:26

同じにはならないでしょう。

なお,あなたの使った「母数」という用語は,用法を間違えています。

No.22245 Re: 交絡因子の取り扱い  【小林】 2016/12/21(Wed) 15:13

青木先生

早々のお返事ありがとうございます。
両者の違いをどのように解釈したら良いかご教示願いますでしょうか?

宜しくお願い申し上げます。

No.22246 Re: 交絡因子の取り扱い  【青木繁伸】 2016/12/21(Wed) 22:12

単変量解析の結果を積み上げても多変量解析にはならないというのは,当たり前の話。

データを層別して分析したのと,群変数も含めて分析した結果が同じ訳がないというのは当たり前。

「どのように解釈」というか,当たり前すぎて,話にならない。

解析対象を限定するというのは,「群を表す(群の特性を表す)変数を除外する」ということと同じ。必要な変数を除くというのと同じ意味を持つ。

多変量解析というのは,「変数セット」での話。
「変数セット」が違うだけで,結果が違うのは当たり前の話。
じゃあ,どの結果が正しいの?というなら,「必要な変数を揃えて分析した結果が正しいだろう」ということ。
更に言えば,「用意された変数が十分なのか?それらの変数の情報を十分に利用した分析なのか?」という質問に答えられないと行けないだろうというのが教科書的な答え。

教科書的な分析ができるかどうかは別のおはなし。

実 験化学的に考えて見れば分かると思うのだけど,母集団に,A,B の二つの属性を持つ個体があるとき,その属性も関与する多変量事象(まあ,大ざっぱにいって疾患とか)についてデータをとって分析するとき,A, B のデータをどのような割合で取るか?ということを考えましょう。A:B は 1:1 でよいのか?母集団で A:B が 1:1 でないなら,それはダメでしょう。A:B = 1:10 とか A:B = 1000:1 なんていうデータを取ったらどんな悲惨な結果になるか。だからといって,A だけのデータを取ったら,それは A:B = 1:0 なんだから,よっぽど変な話になりそうだというのは誰にもわかるのでは?

また,「(疫学)調査には対照群が必要」というのもよく言われる話。「ある疾患に,ある要因が関係ある」という話をするときに,「ある疾患の患者」だけを調査して,「ある要因」が関係あるかないかは,いえないですね。

No.22247 Re: 交絡因子の取り扱い  【小林】 2016/12/22(Thu) 11:45

青木先生

詳細な回答ありがとうございます。
申し訳ありません。私の言葉足らずでして,
どちらのやり方が正当なのかをお伺いしたかったまでです。
理解できました。
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る