★ ロジスティック回帰分析の独立変数の制限について教えてください. No1 ★

 296 ロジスティック回帰分析の独立変数の制限について教えてください. No1  ずぶ  2001/10/01 (月) 10:47
  299 Re: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 12:00
   300 Re^2: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 12:00
    304 Re^3: ロジスティック回帰分析の独立変数の制限について教えてください. No1  ずぶ  2001/10/01 (月) 12:40
     306 Re^4: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 13:15


296. ロジスティック回帰分析の独立変数の制限について教えてください. No1  ずぶ  2001/10/01 (月) 10:47
統計勉強中の内科医です.全く手がかりがありません教えてください.
独立変数をA(段階値,5段階評価),B,C,B/C(つまり独立変数BをCで割ったもの), D(Dはダミー変数)の5変数として質的従属変数(0 or 1)のロジスティック回帰分析を行いたいのですが,そもそも

1) 「B/C」という独立変数の設定は可能なのでしょうか?
ちなみに相関行列係数は
         A        B        C       B/C        D
A      1.00     0.30     0.24     -0.23     0.01
B      0.30     1.00     0.63      0.21     0.17
C      0.24     0.63     1.00     -0.39     0.47
B/C   -0.23     0.21    -0.39      1.00    -0.47
D      0.01     0.17     0.47     -0.47     1.00
2) Dは独立変数として問題ないのでしょうか? 問題ないとすれば,ダミー変数の数はいくつまでOKなのでしょうか?

3) 独立変数相互の関係をしめすため,独立変数の妥当性を示すためにダミー変数,段階値を含む場合でも,相関行列係数が適当なのでしょうか? 

4) 従属変数が「0群」が980ケース,「1群」20ケース(非癌症例980症例,癌症例20症例のように場合)のように偏っている場合にも用いることが適当なのでしょうか?

     [このページのトップへ]


299. Re: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 12:00
> 1) 「B/C」という独立変数の設定は可能なのでしょうか?
そのように定義される変数が実学的意味を持っているのなら差し支えないと思います。

> 2) Dは独立変数として問題ないのでしょうか? 問題ないとすれば,ダミー変数の数はいくつまでOKなのでしょうか?

差し支えないです。
いくつあってもかまいません。(理論的な限界,すなわち全変数の個数がケース数を上回ってはいけない,というのはありますが)

つづく

     [このページのトップへ]


300. Re^2: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 12:00
> 3) 独立変数相互の関係をしめすため,独立変数の妥当性を示すためにダミー変数,段階値を含む場合でも,相関行列係数が適当なのでしょうか? 

ダミー変数と量的変数間の相関係数は問題ありません。
段階値というのは順序尺度の変数ということですね。順序尺度変数と間隔尺度変数(ダミー変数)間の相関係数をとるのは若干問題があります。順序を表す1,2,3を間隔尺度と仮定できれば近似的にはかまわないでしょう。
順序尺度変数もダミー変数にしてしまえば問題はなくなります。

> 4) 従属変数が「0群」が980ケース,「1群」20ケース(非癌症例980症例,癌症例20症例のように場合)のように偏っている場合にも用いることが適当なのでしょうか?

ケース数に偏りがあること自体は問題ないですが(だって,現実のガン・非ガンの割合を考えれば...),ガン症例が20例というのは少なすぎるかもしれませんね。実際の比率を抜きにして,1:1とか1:nで割り付けて分析することが多いとは思います。
> つづく

     [このページのトップへ]


304. Re^3: ロジスティック回帰分析の独立変数の制限について教えてください. No1  ずぶ  2001/10/01 (月) 12:40
青木繁伸 先生

 ご多忙のことと存じますが,早速,ご丁寧にご教授いただき感謝いたします.ご教授していただいた内容に一部質問がありますので,再度お教えいただければ幸いです.

>> 3) 独立変数相互の関係…(中略)…相関行列係数が適当なのでしょうか? 
> 順序を表す1,2,3を間隔尺度と仮定できれば近似的にはかまわないでしょう。
> 順序尺度変数もダミー変数にしてしまえば問題はなくなります。

つまり,順序尺度を何らかのcutoffを作り,0 or 1にすると言うことなのでしょうか? そのほうが,間隔尺度と仮定できる場合より好ましいのでしょうか?

     [このページのトップへ]


306. Re^4: ロジスティック回帰分析の独立変数の制限について教えてください. No1  青木繁伸  2001/10/01 (月) 13:15
> > 順序尺度変数もダミー変数にしてしまえば問題はなくなります。
>
> つまり,順序尺度を何らかのcutoffを作り,0 or 1にすると言うことなのでしょうか? そのほうが,間隔尺度と仮定できる場合より好ましいのでしょうか?

たとえば5件法のデータだと,0,1,2,3,4というデータをとります(1,2,3,4,5でもいいけど,説明にはこれが都合がいい)。
これを4つのダミー変数に変換するのです。
たとえば d1, d2, d3, d4 として,
もとのデータ d1  d2  d3  d4
  0     0  0  0  0
  1     1  0  0  0
  2     0  1  0  0
  3     0  0  1  0
  4     0  0  0  1
とするのです。つまり,元のデータ0を基準として,もとのデータが1である効果を表すのがd1,2はd2,,,というようになります。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る