★ log rank 検定 SAS方式とは? ★

2553. log rank 検定 SAS方式とは? 大羽成征 2004/03/03 (水) 10:52
└2557. Re: log rank 検定 SAS方式とは? 青木繁伸 2004/03/03 (水) 12:40
 └2561. Re^2: log rank 検定 SAS方式とは? 大羽成征 2004/03/03 (水) 14:00
  └2563. Re^3: log rank 検定 SAS方式とは? 青木繁伸 2004/03/03 (水) 15:11
   └2566. Re^4: log rank 検定 SAS方式とは? 大羽成征 2004/03/03 (水) 16:06
    └2567. Re^5: log rank 検定 SAS方式とは? 青木繁伸 2004/03/03 (水) 16:42
     └2574. Re^6: log rank 検定 SAS方式とは? 大羽成征 2004/03/03 (水) 21:52


2553. log rank 検定 SAS方式とは? 大羽成征 [URL]  2004/03/03 (水) 10:52
駆けだし研究者の大羽@NAIST といいます。
もう数年も前から,統計科学自習ノートの全てのページを辞書代わりに使わせていただき,たいへん重宝させていただいております。この場を借りて厚くお礼申し上げます。

表題の件ですが,
http://aoki2.si.gunma-u.ac.jp/lecture/Survival/lr.html
log rank 検定を上記解説をもとに MATLAB にて実装しようとしていたのですが,
http://aoki2.si.gunma-u.ac.jp/R/logrank.html
と同じ結果を再現するのに手間取りました。
現在までになんとか「富永による検定方式によるもの」は再現できましたが,「SAS等と同じ検定方式によるもの」はまだ再現できません。

そこで質問と要望ですが,

■質問

「富永による検定方式」と「SAS等と同じ検定方式」とでは何が異なるのでしょうか?たぶん同一時刻に死亡した例の取り扱いかたに関するところになにか見解の相違があるのだろうと予想しているのですが,いまいちはっきりつかめていません。

■要望

青木先生の解説記事で,「時間 ti」と書いてあるときに,具体的にどういう時間範囲を指すかよく分からずにとまどいました。とりあえずまともな計算結果を出すことはできているのですが,まだいまいち納得いっておりません。
「時刻 t=t1」という言葉とか,もしくは「時間範囲 t1 > t >= t2」のような,もうすこしあいまいさを減らした表現での説明をご検討いただけると助かります。

     [このページのトップへ]


2557. Re: log rank 検定 SAS方式とは? 青木繁伸  2004/03/03 (水) 12:40
> 青木先生の解説記事で,「時間 ti」と書いてあるときに,具体的にどういう時間範囲を指すかよく分からずにとまどいました。

データとして記録されている,相異なるデータのことです。
日単位で記録されているなら日,ですし,週単位で記録されているなら週です。

記述の通りです。
>A 群,B 群をひとまとめにして,相異なる死亡時間が k 個あったとする( t1 > t2 > ... > tk )。
> 時間 ti での A 群,B 群の死亡数を oai,obi

死亡時間を(同値を除いて)長い順に並べて,

2.12, 1.43, 1.41, 0.79,.... となっているなら

t1=2.12
t2=1.43
t3=1.41
t4=0.79
です。明確です。

「1.43 と 1.41 を区別するのか?」というなら,
「区別したいからデータをそのように記述したのであろうから,もし区別しないのなら,1.43も 1.41 も たとえば 1.4 と記録すればいいだけでしょう。」とお答えするしかありません。

     [このページのトップへ]


2561. Re^2: log rank 検定 SAS方式とは? 大羽成征 [URL]  2004/03/03 (水) 14:00
早速のご返答ありがとうございます。

> データとして記録されている,相異なるデータのことです。
> ...
> 死亡時間を(同値を除いて)長い順に並べて,
> ...

実際の死亡時刻と,データとして量子化された時刻データ値との違いで,私の混乱が生じていたように思えます。log rank 検定では,最初から最後まで時刻データそのものだけを扱うということですね。
また,死亡時間を長い順に並べるときに,同値を除くべきであることに気付くまでに結構悩んでしまいました。
それから「死亡時間」とは,言い換えれば「死亡例の生存期間」のことですね?これもなかなか気付きませんでした。打ち切り症例の観測期間をどのように入れるか?も,理解するまで骨が折れました。
以上を理解するために「統計科学自習ノート」以外に,「生存時間解析-SASによる生物統計」大橋靖雄・浜田知久馬 著 東京大学出版会 も参考にしましたが,後者は記述が大量なわりに計算アルゴリズムの肝心のところが書いてなかったりしてあまり役に立ちませんでした (計算自体はSASを使えという立場から書かれた本ですから仕方ありませんが…)。

いちおうここまではなんとか理解したつもりなのですが,まだ「富永式 log rank P値」と「SAS式 log rank P値」の違いは謎のままです。上記の本を読んでもよく分かりませんでした。こちらを改めて,質問し直してもよろしいでしょうか。
もしくは,SAS内の計算アルゴリズムに関する解説が得られるような,お薦めの参考書・論文などありますでしょうか?(英語でもかまいません)

     [このページのトップへ]


2563. Re^3: log rank 検定 SAS方式とは? 青木繁伸  2004/03/03 (水) 15:11
> まだ「富永式 log rank P値」と「SAS式 log rank P値」の違いは謎のままです。上記の本を読んでもよく分かりませんでした。こちらを改めて,質問し直してもよろしいでしょうか。

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc025/356.html
に言及があるのと,R のプログラム
    v <- sum(dt*(nt-dt)/(nt-1)*na/nt*(1-na/nt), na.rm=TRUE)
    chi3 <- (sum(da)-sum(na*d))^2/v
    result3 <- c(chi3, 1, pchisq(chi3, 1, lower=F))
    names(result3) <- c("Chi-sq.", "d.f.", "P value")
につきるのですが。

アルゴリズムの記述において,プログラムは簡潔であっても,冗長な文章に比べて遙かに正確無比ですね。

     [このページのトップへ]


2566. Re^4: log rank 検定 SAS方式とは? 大羽成征 [URL]  2004/03/03 (水) 16:06
R のプログラムの解読を始めました。SもRも初めてなのですが,なんとか読めそうな気がしてきました。これが読めた後に,

「この違いが生じる理由」
「どういうときに,どちらを使うべきなのか。それは何故か」

が次の疑問になります。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc025/356.html
は以前に拝見いたしましたが,この疑問に関してあまり足しにはなりませんでした。ともかく R のプログラムをきちんと理解してから考えてみることにします。何か分かったら(もしくは分からなかったら)またここに書き込みに来ます。お騒がせしてすみませんでした。

     [このページのトップへ]


2567. Re^5: log rank 検定 SAS方式とは? 青木繁伸  2004/03/03 (水) 16:42
> http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc025/356.html
> は以前に拝見いたしましたが,この疑問に関してあまり足しにはなりませんでした。

# 385 の J. J. Gart, D. Krewski, P. N. Lee, R. E. Tarone & J. Wahrendorf The Desing and Analysis of Long-term Animal Experiments IARC Scientific publication
も役に立ちませんでしたか?この本はかなり詳しく書いてあります(もう古くなってしまいましたがね)。

     [このページのトップへ]


2574. Re^6: log rank 検定 SAS方式とは? 大羽成征 [URL]  2004/03/03 (水) 21:52
おかげさまで,SAS方式も再現できました。しかし,やはりというべきか,何故あんな計算になっているのかさっぱり分かりません。SAS式も na, nb, da, db をそのまま用いているということから,同一時点死亡例の取り扱い and/or 打ち切り例の取り扱いが異るだけだ,というわけではなかったようです。

> # 385 の J. J. Gart, D. Krewski, P. N. Lee, R. E. Tarone & J. Wahrendorf The Desing and Analysis of Long-term Animal Experiments IARC Scientific publication
> も役に立ちませんでしたか?この本はかなり詳しく書いてあります(もう古くなってしまいましたがね)。

これを読めば分かるのでしょうか?
ありがとうございます。まだ見ていませんでしたので,ともかく探してみます。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 028 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る