No.11655 多変量ロジスティック回帰分析  【Z】 2010/01/06(Wed) 16:08

多変量ロジスティック回帰分析が議題に挙がったので,便乗して教えてください。
ロジスティック回帰に使用する変数についてですが,CRPのような連続変数も使用できるとのことでしたが,順序変数のようなものも使用してよいのでしょうか?
た とえば,転移個数 (1) なし, (2) 一個, (3) 多数みたいな変数を用いてもデータは信頼できるのでしょうか?とくに上記の場合,(1), (2), (3) それぞれの間が等間隔でない(感覚的な表現で申し訳ないのですが)場合などにも使用できるのでしょうか?

No.11657 Re: 多変量ロジスティック回帰分析  【surg】 2010/01/06(Wed) 16:54

> 順序変数のようなものも使用してよいのでしょうか?

できますよ.Rだとこんな具合です.
> dead <- c(0, 0, 0, 0, 0, 1, 0, 1, 1)
> outcome <- gl(3, 3)
> summary(glm(dead ~ outcome, family = binomial()))

Call:
glm(formula = dead ~ outcome, family = binomial())

Deviance Residuals:
Min 1Q Median 3Q Max
-1.482e+00 -9.005e-01 -7.976e-05 9.005e-01 1.482e+00

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -19.57 6208.83 -0.003 0.997
outcome2 18.87 6208.83 0.003 0.998
outcome3 20.26 6208.83 0.003 0.997

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 11.4573 on 8 degrees of freedom
Residual deviance: 7.6382 on 6 degrees of freedom
AIC: 13.638

Number of Fisher Scoring iterations: 18

> summary(glm(dead ~ as.ordered(outcome), family = binomial()))

Call:
glm(formula = dead ~ as.ordered(outcome), family = binomial())

Deviance Residuals:
Min 1Q Median 3Q Max
-1.482e+00 -9.005e-01 -7.976e-05 9.005e-01 1.482e+00

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.522 2069.611 -0.003 0.997
as.ordered(outcome).L 14.325 4390.307 0.003 0.997
as.ordered(outcome).Q -7.139 2534.745 -0.003 0.998

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 11.4573 on 8 degrees of freedom
Residual deviance: 7.6382 on 6 degrees of freedom
AIC: 13.638

Number of Fisher Scoring iterations: 18
> たとえば,転移個数 (1) なし, (2) 一個, (3) 多数 みたいな変数を用いてもデータは信頼できるのでしょうか?

これは統計学とは別の問題でしょう.数値データがあるのならば,当然それを使うべきです.

> とくに上記の場合,(1), (2), (3) それぞれの間が等間隔でない(感覚的な表現で申し訳ないのですが)場合などにも使用できるのでしょうか?

ordered factor とはそういうものです.

No.11658 Re: 多変量ロジスティック回帰分析  【Z】 2010/01/06(Wed) 16:56

Surg様
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る