No.14535 重回帰分析の95%CIについて  【玉置浩二】 2011/04/19(Tue) 14:20

初めて投稿します。よろしくお願いします。
私は医学部の大学院生ですが,統計に関してはほぼ初心者であり,知識はほぼ0に等しい状況です。
現 在,ある英論文を執筆中なのですが,Aに対してそれぞれ単変量解析で有意であった因子B,C,Dについて,この3因子で多変量解析を行ったところ,いずれ も有意であった(P<0.05)のですが,95%CIが極端な数値になってしまいました。特に3因子のうちの1つでは,OR: 173.88,95%CI: 8.96-3375.03という不安定なものになってしまいました。
この結果について,少し統計の知識がある知人に 尋ねてみたところ,全体の例数が多変量のlogistic回帰を行う上では少ないことと,特に1例のセルがあることだとの回答でした。計算そのものは妥当 であり,有意であることには違いがないとのことでしたが,いまひとつ理解が難しいのと,それをどのように英文にすればよいのかかわかりません。
どなたか,初心者でも解りやすい回答を頂けないでしょうか。よろしくお願いします。

No.14536 Re: 重回帰分析の95%CIについて  【青木繁伸】 2011/04/19(Tue) 15:32

> Aに対してそれぞれ単変量解析で有意であった因子B,C,Dについて,この3因子で多変量解析を行ったところ,いずれも有意であった(P<0.05)のですが,95%CIが極端な数値になってしまいました。

何度も質問されるものですが,単変量解析の結果を寄せ集めても多変量解析の結果には成りません。

ところで,タイトルは「重回帰分析の...」ということですが,本当に重回帰分析ですか?
単変量解析,多変量解析というのも Cox の比例ハザードモデルという「多変量解析の一手法」に過ぎないのに,その分野においては「多変量解析=Coxの比例ハザードモデル」になっているようで,困ったものです(独立変数が1個のときが「単変量解析」)。
単変量解析してから多変量解析するのが医学論文のひな形のようになっているのも,困ったものです。

> 特に3因子のうちの1つでは,OR: 173.88,95%CI: 8.96-3375.03という不安定なものになってしまいました。

「不 安定」と判断した因子を除く理由を明示し,それを除いた結果を提示すればそれで済むことでしょう。単変量解析で有意になった因子をすべて入れなければなら ないなどという理由はありません。単変量解析で有意でなくても,多変量解析で有意になる変数だってあります。先行研究では有意な変数ならば,あなたのデー タでは有意でない変数だってモデルに含めないといけないことだってあるでしょう。

> 全体の例数が多変量のlogistic回帰を行う上では少ないこと

必ずクレームがつきますね。

> 特に1例のセルがあること

その 1 例のセルを近傍のセルと併合して分析すると結果は変わりますか?変わるならば,併合した方の結果を使えば良いと思います。

いずれにせよ,サンプルサイズ(エンドポイント)が少ないのが問題でしょう。

> 計算そのものは妥当であり,有意であることには違いがないとのことでしたが

計算の妥当性(正しさ)と統計学的な結果(有意)とは,無関係ですね。その結果が,医学的にどのような妥当性のある解釈を導くかは,コンピュータも,統計学も関係ありません。

> いまひとつ理解が難しいのと,それをどのように英文にすればよいのかかわかりません。

まずは,それを「日本語で書くとしたらどうなるのか」でしょう。日本語と英語の問題ではありません。

> 統計に関してはほぼ初心者であり,知識はほぼ0に等しい状況

は,謙遜でしょうが,

> 初心者でも解りやすい回答

というのは,難しいものですよ(それをそのまま論文に書いても論文としては不十分で,論文として通るように書くと初心者にはわからないでしょう)。
ちゃんとした論文を書くには,あなたが初心者から卒業することがまず必要です。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る