No.09474 ベースライン値と変化値を一度にいれていいですか?  【近藤真彦】 2009/03/07(Sat) 13:48

とある薬が悪玉細胞の数を減らすかどうかの臨床試験です.200人ほどの患者をランダムに薬組と偽薬組にわけて,それぞれ の薬を一定期間飲んでもらいます.その前後の悪玉細胞の数を比べるのですが,肥満度と密接な関係があることが予測されるので,薬による治療の前後の BMI も記録します.BMI_0 が治療前,BMI_1 が治療後の値だとします.肥満度との関係を調べる時に,治療前のBMI_0と,BMI値の変化 BMI_d = BMI_1 - BMI_0 のどちらも興味深いので BMI_0 と BMI_d の両方を linear regression の右辺にいれたいのですが,何か問題があるような気がします.Y_1 を治療後の悪玉細胞の数, Y_0 を治療前の悪玉細胞の数,X は治験薬なら1,偽薬なら0として R 風に書くと lm( Y_1 ~ X * (Y_0 + BMI_0 + BMI_d ) ) ということです.BMI_0 が二度現れるのがしっくりしません.このように解析すると,何か問題があるのでしょうか?どうぞよろしくお願いします.

No.09476 Re: ベースライン値と変化値を一度にいれていいですか?  【青木繁伸】 2009/03/07(Sat) 16:50

以下の例で,ans1, ans2, ans3 の結果を比較してみるとよいでしょう。係数の見かけでは ans1 も ans2 も ans3 も,全部違いますが,R2 や F 等の他,なによりも predict はどれも同じになります。当たり前なのです。ans1 がしっくり来なければ,ans3 でやればよいでしょう。
set.seed(123)
n <- 500
data <- data.frame(y.1=rnorm(n), y.0=rnorm(n, mean=0.3),
bmi.0=rnorm(n, mean=25, sd=3), bmi.1=rnorm(n, mean=23, sd=3),
x=sample(0:1, n, rep=TRUE))
data$bmi.d <- data$bmi.1-data$bmi.0
res1 <- lm(y.1~x*(y.0+bmi.0+bmi.d), data)
res2 <- lm(y.1~x*(y.0+bmi.0+I(bmi.1-bmi.0)), data)
res3 <- lm(y.1~x*(y.0+bmi.0+bmi.1), data)
summary(res1)
summary(res2)
summary(res3)
predict(res1)[1:10]
predict(res2)[1:10]
predict(res3)[1:10]

No.09481 Re: ベースライン値と変化値を一度にいれていいですか?  【近藤真彦】 2009/03/08(Sun) 00:02

青木先生,どうもありがとうございます.よく考えればそうですね.ちゃんと納得できました.これからもがんばります.

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る