No.21714 多変量モデルの選択  【hemotorogy】 2015/06/30(Tue) 23:12

ご教示をよろしくお願いいたします。

前処置の種類により末梢血幹細胞輸血の効果に違いが出るのかを検証したいと考えています。共変量が存在するため多変量解析を施行する予定です。
アウトカムは幹細胞の定着の有無ですが,定着までの時間も考慮したいのでCOX比例ハザードモデルを使用しようかと考えています。(観察期間を終了しても定着してないものは打ち切りとします)
しかし,アウトカムが有害事象ではないため「ハザードモデル」という名前に少し抵抗を感じます。
定着率はロジステック回帰モデルを,定着までの時間は重回帰分析というように2つの解析法を併用したほうがよいのでしょうか?

よろしくお願い致します。

No.21715 Re: 多変量モデルの選択  【青木繁伸】 2015/07/02(Thu) 06:32

> アウトカムが有害事象ではないため「ハザードモデル」という名前に少し抵抗を感じます。

そんなことにこだわる必要はいささかもありません

No.21716 Re: 多変量モデルの選択  【hemotorogy】 2015/07/02(Thu) 13:33

青木先生

御回答ありがとうございました。
アウトカムが有害事象でない場合に比例ハザードモデルを使用している論文をみたことがなかったので,少し気掛かりだったのですが,安心しました。

No.21718 Re: 多変量モデルの選択  【青木繁伸】 2015/07/02(Thu) 21:40

「事象の発生」を対象にするわけですから,その事象が望ましことであろうとそなかろうと,何の関係(価値観)もないわけですよね。
そもそも,従属変数は本来(オッズ,オッズ比という文脈から)は「成功/失敗」に過ぎなかったわけで,そういう意味では,「死亡が成功?」という疑問がでるべきものなんですけど。
ようするに,「成功」というのは,「研究者が期待する事象」ということです。
研究者が期待する(研究の対象)が死亡ということならば,イベントは死亡でしょう。
投資が成功するかというのが目的なら,文字通り「投資が成功する」というのが従属変数でしょう。逆なら,「投資が失敗する」ということになるわけです。どちらを目的にするかで,解釈は違ってくるということでしょ?
²値変数のどちらを対象にするかの違いでしょう?

同じ従属変数を,1の場合を対象にするか,0の場合を対象にするかは,「同じ結果を得る」ということを示す分析結果> d <- data.frame(
+ y=c(1,1,1,1,1,1,1,1,1,1,0,0,0,0),
+ x=c(1,2,3,4,2,3,4,2,1,7,8,8,5,6)
+ )
> a <- glm(y~x, d, family=binomial) # 従属変数が 1 である場合についての分析
> summary(a)

Call:
glm(formula = y ~ x, family = binomial, data = d)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.5066 -0.2746 0.1946 0.3293 1.7972

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 6.098 3.001 2.032 0.0422
x -1.070 0.540 -1.982 0.0475

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 16.7515 on 13 degrees of freedom
Residual deviance: 7.8746 on 12 degrees of freedom
AIC: 11.875

Number of Fisher Scoring iterations: 6

> d$y <- 1-d$y # 従属変数の逆の状態を対象に分析する
> a <- glm(y~x, d, family=binomial) # 元の従属変数が 0 である場合についての分析
> summary(a)

Call:
glm(formula = y ~ x, family = binomial, data = d)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.7972 -0.3293 -0.1946 0.2746 1.5066

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.098 3.001 -2.032 0.0422
x 1.070 0.540 1.982 0.0475

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 16.7515 on 13 degrees of freedom
Residual deviance: 7.8746 on 12 degrees of freedom
AIC: 11.875

Number of Fisher Scoring iterations: 6

No.21719 Re: 多変量モデルの選択  【hemotorogy】 2015/07/02(Thu) 23:09

青木先生

具体例を挙げての詳しい説明ありがとうございました。

とても勉強になりました。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る