No.13578 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【理人】 2010/10/09(Sat) 01:30

このたびはお世話になります,どうぞよろしくお願い申し上げます
内視鏡治療における一括切除率にどのような因子が 関与しているかを多変量解析にて検討しようとしております。症例数は361例でそのうち一括切除できなかった例は6例のみです。単変量解析で有意となる因 子をピックアップしてきて,多変量解析に組み込もうとしてカイ2乗検定とロジスティック回帰分析を行いました。その際,カイ2乗検定の2×2のうち,項目 が0になるものがあります たとえばLaterally marginという項目について
         一括   非一括  p値
Laterally margin 0.0002*(Fisher検定)
(-)     355 (100) 4 (66.7)
(+)      0   2 (33.3)
と,一括ではlaterally marginが(+)であるものはない,ということになります。これが有意差があるということは感覚的に正しく,一括はlaterally marginのないものということが定義になっています。
ところが,多変量ロジスティック回帰分析をするために単変量ロジスティック回帰分析をlaterally marginでおこなったところ,

Laterally margin  p値  Odds (95%CI)
(-)      1(reference)
(+)      0.97 48096274.600 (0.00-上限なし)
となり,p値は0.97と有意差がなく,しかも95%CIの上限値がない,ということになってしまいます。
こ の場合,カイ2乗検定と単変量ロジスティック回帰分析のp値の乖離はどのように考えるべきでしょうか?またどのような単変量解析をもちいて多変量解析に使 う因子を決定するべきでしょうか?(今まではロジスティック解析を用いていたのすが,今回このようなことになって悩んでおります)

No.13579 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【青木繁伸】 2010/10/09(Sat) 18:20

この掲示板に,少しずつ違うけど根本的に同じ質問がよくされます。

> どのような単変量解析をもちいて多変量解析に使う因子を決定するべきでしょうか?

単 変量解析で多変量解析に使う変数を選択するのは,間違いです(論文などでもよく採用されるアプローチですけど)。単変量解析で有意であるものが多変量解析 では有用ではない,あるいはその逆というのはよくあるとは言わないまでもあり得ることです。そうでなければ,わざわざ面倒な多変量解析の存在意義がありま せん。単変量解析の結果を寄せ集めても,多変量解析にはなりません。

質問に対する回答としては,「多変量解析で変数選択を行うべし」ということです。変数選択機能が用意されていないときは,手動でやるしかないです。

No.13588 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【理人】 2010/10/11(Mon) 11:28

早速お返事いただきましたのに,お礼が遅れまして誠に恐縮です,ご指導ありがとうございました 過去ログをしっか り勉強できておらず申し訳ございません,大変参考になります 早速,多変量解析を行ってみようと思います。危険因子(独立変数?)の選択をステップワイズ 法にて行うのをよく見かけるのですが,それでよろしいでしょうか?症例数の数の割に,危険因子の数が多いように愚考いたしております。 症例は胃,食道, 大腸などに分かれていて,その各臓器別に検討しないといけないのですが,症例数が最も少ない食道で138例あり,そのうち,内視鏡治療中の偶発症の発生率 やlaterally marginの発生率など(多変量解析において従属変数になる)は低くて6例―10例程度までで,危険因子になりうる変数は14因子くらいです。
基礎的な質問で誠におそれいりますが,またご指導賜れましたら幸甚です。なにとぞよろしくお願い申し上げます

No.13591 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【青木繁伸】 2010/10/11(Mon) 19:59

> 危険因子(独立変数?)の選択をステップワイズ法にて行うのをよく見かけるのですが,それでよろしいでしょうか

そのように回答しましたよね。念押しは不要と思いますが?無用にスレッドが伸びると思いますけどね。

> 症例数が最も少ない食道で138例あり,そのうち,内視鏡治療中の偶発症の発生率やlaterally marginの発生率など(多変量解析において従属変数になる)は低くて6例―10例程度までで,

サンプルサイズはともかく,イベント数が少なすぎ。

No.13592 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【後医は名医】 2010/10/11(Mon) 20:55

>症例数の数の割に,危険因子の数が多いように愚考いたしております。

その通りです。

> 症例数が最も少ない食道で138例あり,そのうち,内視鏡治療中の偶発症の発生率やlaterally marginの発生率など(多変量解析において従属変数になる)は低くて6例―10例程度まで

過 去ログにもありますが,とれる独立変数の目安はイベント数/10までとされていますので,全部で138例あっても,陽性数が6〜10例ではこの計算でいく と独立変数は0.6〜1個とせいぜい1つしかとれません。これで独立変数を14個もとって解析しても説得力がないし,ステップワイズ法云々で悩む以前の問 題だと思います。

No.13593 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【理人】 2010/10/11(Mon) 20:56

お返事,恐縮です スレッドを伸ばしてしまって申し訳ありません
大変参考になりました,ありがとうございました

No.13598 Re: 多変量解析のための単変量解析の結果の乖離(カイ2乗検定とロジスティック回帰分析)  【TY】 2010/10/12(Tue) 09:40

蛇足ですけれど,最初にあげられているデータはQuasi-complete separation (擬似完全分離) になっており,ロジスティック回帰での最尤推定ができない状況になっています。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る