★ ロジステック回帰? ★

 323 ロジステック回帰?  T.Med  2003/04/30 (水) 00:18
  328 Re: ロジステック回帰?  青木繁伸  2003/04/30 (水) 17:03
  325 Re: ロジステック回帰?  直観ですが,  2003/04/30 (水) 11:22
  324 Re: ロジステック回帰?     2003/04/30 (水) 10:39


323. ロジステック回帰?  T.Med  2003/04/30 (水) 00:18
ある検査法で癌を検出できるかどうかについて,どのような因子が影響を及ぼしているかを統計を用いて判断する場合にどのような手法を使用すればいいのでしょうか教えてください。
独立変数は癌の大きさ,深さ,患者の年齢,性別
従属変数は検査で検出可能か否かです。ロジステック回帰で統計を行ったのですが,検査をした数が150で検出できた数が140と多いのでたまたま検出できなかった10例に女性が9人いた場合それだけで検出できなかった原因として女性であることが有意に影響を及ぼすといった結果になってしまいますがこの結果はおかしいのでしょうか,また他の手法で統計したほうがいいのでしょうか教えてください。

     [このページのトップへ]


328. Re: ロジステック回帰?  青木繁伸  2003/04/30 (水) 17:03
> ある検査法で癌を検出できるかどうかについて,どのような因子が影響を及ぼしているかを統計を用いて判断する場合にどのような手法を使用すればいいのでしょうか教えてください。
> 独立変数は癌の大きさ,深さ,患者の年齢,性別
> 従属変数は検査で検出可能か否かです。

単なる判別分析のことを考えると分かるかと思いますが,判別すべき二群の例数が140と10というのは相当アンバランスですね。10例というのは少なすぎると思います。
どのような検査法か分かりませんが,素人でも癌の大きさ深さは確かに関係しそうですが,年齢とか性別が関係するのかどうかはかなり疑わしいと思います。
理論的に考えて,どのような独立変数が考えられるか,よく精査してからデータ解析すべきでしょう。そうでないと,出てきた結果の解釈に悩むことになります。

多変量解析に進む前に,二群の平均値(代表値)の差の検定なんかはやってみましたか?そのステップを踏んでいれば,要因を何でもかんでも取り上げようという気にはならないと思うのですが(つまり,男女で検出率が違うか?などとは考えないのではないかと思ったりするんです)。

     [このページのトップへ]


325. Re: ロジステック回帰?  直観ですが,  2003/04/30 (水) 11:22
> 従属変数は検査で検出可能か否かです。ロジステック回帰で統計を行ったのですが,検査をした数が150で検出できた数が140と多いのでたまたま検出できなかった10例に女性が9人いた場合それだけで検出できなかった原因として女性であることが有意に影響を及ぼすといった結果になってしまいます

たしかに男女75人ずつと仮定して
http://aoki2.si.gunma-u.ac.jp/exact/exact.html
でやると0.01ぐらいになりますね,,,

そもそもどうして男女で違いがでてくるという仮説を立てたのか?
が問題ではないでしょうか?象好きとロバ好きでやってみたり,A型とB型でやってみたり,右利きと左利きでやってみたり,手当たり次第すれば,いろいろ解釈のしにくい有意な群分けができるのではないでしょうか?

また別の次元のはなしですが,ロジスティックではnが大きくてもイベントがすくなければ,レグレッサー(説明変数)は多くてきないのでは?
10例が問題なのであれば,リグレッサーはひとつぐらいまでではないでしょうか?

ロジスティックは0セル問題がおこったりして,誤用がおおいので,
是非青木先生にもっとわかりやすい説明をお願いしたいです。

     [このページのトップへ]


324. Re: ロジステック回帰?     2003/04/30 (水) 10:39
> たまたま検出できなかった10例に女性が9人いた場合それだけで検出できなかった原因として女性であることが有意に影響を及ぼすといった結果になってしまいますがこの結果はおかしいのでしょうか,

それが「たまたま」であるというのがあなたの結論ならば,性別を説明変数として使おうという出だしがおかしいわけです。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 024 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る