No.12234 ロジスティック回帰と順序付き変数と多項対比の解釈  【taipapa】 2010/03/07(Sun) 21:41

No. 12222のスレッドで教えていただいたことに関することですが,長くなるので,スレッドを変えます.以下に述べる順序あり変数を含むlogistic regressionにおける多項対比の場合の結果の解釈についてご教示いただければ幸いです.
Rでは,知ったかぶりさんや青木先生がご指摘のように,
> options("contrasts")
$contrasts
unordered ordered
"contr.treatment" "contr.poly"
ですので,unordered factorには処理対比が,ordered factorには多項対比が使われるのがデフォルトになってます.従って,私の例では,
> contrasts(HiseverityNonordered)
moderate severe
mild 0 0
moderate 1 0
severe 0 1

> contrasts(HiseverityOrdered2)
.L .Q
mild -7.071068e-01 0.4082483
moderate -7.850462e-17 -0.8164966
severe 7.071068e-01 0.4082483
となります.その結果,No.12222で報告したようなL (linear),Q (quadratic)の表示となりました.そこで,
> options(contrasts=c("contr.treatment", "contr.treatment"))
とすれば,
> contrasts(HiseverityOrdered2)
moderate severe
mild 0 0
moderate 1 0
severe 0 1
となって,以下のように望んでいたmildを基準にしての結果が出力されるようになりました.
HiseverityOrdered2moderate    0.82822    0.65375   1.267   0.2052    
HiseverityOrdered2severe 5.85450 1.29706 4.514 6.37e-06 ***
し かし,これは,nonordered factorにした時と全く同じ結果であり,moderateとsevereの間に差があるのか,positive trendがあるのかどうかも不明のままでordered factorにした意味がないように思えます.そこで,もう一度,
> options(contrasts=c("contr.treatment", "contr.poly"))
と多項対比に戻して,以下を得ました.
HiseverityOrdered2.L       4.13976    0.91716   4.514 6.37e-06 ***
HiseverityOrdered2.Q 1.71385 0.65738 2.607 0.00913 **
そ の意味を考えると,linearの項が正なのでmildからsevereへの増加傾向があり,かつ,quadraticの項も正なので,下に凸の放物線を 描いてmild --> moderate --> severeとoutcomeがpoorになる確率が増加すると言うことなのかと解釈しました.これは,実際の臨床上での印象とも一致します.こういう解 釈で正しいのでしょうか?

また,よく考えると,多項対比の解釈は,各カテゴリーが等距離にあるという仮定が前提になってますが,私の例で は,そんな保証はどこにもありません.かの有名なLikert scaleでも同じだと思います.そこで,もう一つの質問は,このような順序付き変数を説明変数とする場合のlogistic regressionはどのように行い,どのように解釈するのが王道(?)なのでしょうか?

奇妙な質問かもしれませんが,ご教示のほど,宜しくお願いします.

No.12239 Re: ロジスティック回帰と順序付き変数と多項対比の解釈  【surg】 2010/03/09(Tue) 16:55

> しかし,これは,nonordered factorにした時と全く同じ結果であり,

そもそも orderd factor に関しては高々n次の多項対比で近似できるだろうとの仮定が前提としてあり, nonorderd factor ではそのような仮定ができないので処理対比が使われているのですから,当然のことです.

> その意味を考えると,linearの項が正なのでmildからsevereへの増加傾向があり,かつ,quadraticの項も正なので,下に凸の放物線 を描いてmild --> moderate --> severeとoutcomeがpoorになる確率が増加すると言うことなのかと解釈しました.これは,実際の臨床上での印象とも一致します.こういう解 釈で正しいのでしょうか?

解釈が妥当かどうかは別にして,推定量自体は mild > moderate < severe となっていますよね.(mild と moderate との大小関係は統計学的に有意ではありませんが)

No.12243 Re: ロジスティック回帰と順序付き変数と多項対比の解釈  【taipapa】 2010/03/09(Tue) 23:31

surgさん,ご指摘有り難う御座います.
そもそも多項対比の意味がよく分かっていなかったので今回勉強になりました.

> (mild と moderate との大小関係は統計学的に有意ではありませんが)

そうなんですよね.mild+moderateとsevereの2郡に分けなおしても良いかもしれないと思案しているところです.

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る