No.06226 比例ハザード  【お医者さん】 2008/03/27(Thu) 02:32

JMPでのCOX比例ハザードについてお聞きします。
悪性腫瘍の予後因子を調べるときに進行度で1期から4期まで に分類して変数として入力する際に,そのままstageを1〜4で入力するのと,stage2をYes or No, Stage3をYes or No, Stage4をYes or Noとして入力する(多二分変数への変換?)方法があると思うのですが,前者ではハザード比が3個,p値が1個,後者では各stageに対してハザード比 とp値が結果として出てきます。
この違いはどのように解釈すればいいのでしょうか?
何か使い分けとかはあるのでしょうか?
また前者で解析した場合にp値は0.05以下なのに,ハザード比はすべて1をまたいだ値になるという結果になってしまいました。
stage1〜4でのハザード比にはlinearityはありそうなのですが,この解析におけるp値はどう解釈すればよろしいでしょうか?

No.06230 Re: 比例ハザード  【青木繁伸】 2008/03/27(Thu) 17:45

> 進行度で1期から4期までに分類して変数として入力する際に,そのままstageを1〜4で入力するのと,stage2をYes or No, Stage3をYes or No, Stage4をYes or Noとして入力する(多二分変数への変換?

> この違いはどのように解釈すればいいのでしょうか

> stage1〜4でのハザード比にはlinearityはありそうなのですが

結果として1〜4の数値を使ってもよいことがわかることがありますが,普通は(多くの場合には)間隔尺度を使えないことがわかる,ということではないでしょうか。

No.06231 Re: 比例ハザード  【お医者さん】 2008/03/27(Thu) 20:59

すいません,言葉がたりませんでした。
stage1〜4を数値としてではなく名義変数として解析するのと,多二分変数に変換するのとで出てくる解析結果の解釈の違いを教えていただけますか?
つまりいずれもHRはstage1に対するstage2,stage3,stage4のhazardという形で結果が出せるのに対して,p値は前者では1個,後者では各hazardに対して1個出てきます。
前者は論文でよく見かけるp for trendということでしょうか?
もしそうだとしたら,このp for trendというのはどのような意味あいでの解釈をすればいいのでしょうか?

No.06232 Re: 比例ハザード  【青木繁伸】 2008/03/27(Thu) 22:17

> 前者は論文でよく見かけるp for trendということでしょうか?

trend は独立変数が時間の場合の用語でしょう。
一般的には,傾き slope ということですよね。
例に挙げられている変数 x は 1,2,3,4 の4種の値しか取らないというだけで,体重や年齢と同じ扱いですよ。
y_hat = a*x + constant
係数 a = 0 の検定は要するに,x の増減で予測値に有意な変化が現れるかと言うこと。xは1,2,3,4という等間隔の値をとるので,x=4 のときの効果は x=1 のときの効果の4倍,x=2 のときは2倍。。。単に,それだけの意味。

x のとるカテゴリーを z1, z2, z3, z4 というダミー変数(0/1変数)で表すと実際は z1, z2, z3, z4 は従属関係にあるので z1 をベースラインとして,z2, z3, z4 の3つのダミー変数で予測ができる。
y_hat = 0*z1 + b*z2 + c*z3 + d*z4 + constant
b,c,d が0であるかの検定は3通り(P値も3つ)。その意味はz2 は有意な効果をもたらすか,z3 はどうか,z4 はどうか,というだけ。c=2b, d=3b なら,線形なので間隔尺度として扱うのと同じになる。

お医者さんが,何を悩んでいるのかよくわからない。

No.06240 Re: 比例ハザード  【知ったかぶり】 2008/03/30(Sun) 10:50

JMPは,名義尺度の変数を内部的にダミー変数に変換します.ユーザーがダミー変数を設定する必要はありません.したがって,
>stage1〜4を数値としてではなく名義変数として解析する
でOKだと思います.

>stage2をYes or No, Stage3をYes or No, Stage4をYes or Noとして入力する

これでは,stage2,3,4という独立の変数について解析することになってしまいます.

No.06241 Re: 比例ハザード  【青木繁伸】 2008/03/30(Sun) 19:35

> これでは,stage2,3,4という独立の変数について解析することになってしまいます.

そうですね。変数選択をするときなんかはまずいことになる可能性があります。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る