一般化 Wilcoxon 検定( Gehan 1965 )     Last modified: Nov 07, 2002

 この検定は,打ち切り例のない場合の Wilcoxon 検定( マン・ホイットニーの $U$ 検定と等価 )の拡張である。

 2 群の生存時間の長さに差があるかどうかを検定する。

 A 群と B 群の全ケース数を $n_a$,$n_b$ とする。A 群,B 群の生存時間を $X_{i}$,$Y_{j}$,打ち切り例については $X_{i}'$,$Y_{j}'$ とする( $i = 1, 2, \dots , n_a\ ;\ j = 1, 2, \dots , n_b$ )。

 両群の生存時間を比較するとき,以下のような検定統計量を定義する。

\[ W = \sum_{i=1}^{n_a} \sum_{j=1}^{n_b} U_{ij} \]  ただし,

\[ U_{ij} = \left \{ \begin{align*} -1 &,  X_i \lt Y_j\ または\ X_i \leqq Y_j' \\ +1 &,  X_i \gt Y_j\ または\ X_i' \geqq Y_j \\ 0 &,  上記以外 \end{align*} \right . \] である。すなわち,生存時間の大小比較において,一方が打ち切り例のとき,例えば $X_{i}$ と $Y_{j}'$ の比較において,もし $X_{i} = Y_{j}'$ であった場合にも,$Y_{j}' = Y_{j} + \alpha \gt Y_{j} \gt X_{i}$ であると考える点が「一般化」の意味するところである。

 検定統計量 $W$ の平均値は 0,分散 $Var ( W )$ は次式のようになる。

\[ Var(W) = \frac{n_a\ n_b}{(n_a+n_b)\ (n_a+n_b-1)}\ \sum_{i=1}^{n_a+n_b} \left ( \sum_{j=1}^{n_a+n_b} H_{ij} \right ) ^2 \]  ただし,$H_{ij}$ は上述の $U_{ij}$ の定義のしかたに準ずるが,2 群のケースをひとまとめにして,生存時間を $X_{i}$,$Y_{j}$,打ち切り例については $X_{i}'$,$Y_{j}'\ ( i, j = 1, 2, \dots , n_a + n_b)$ として,以下のように定義される。

\[ H_{ij} = \left \{ \begin{align*} -1 &,  X_i \lt Y_j\ または\ X_i \leqq Y_j' \\ +1 &,  X_i \gt Y_j\ または\ X_i' \geqq Y_j \\ 0 &,  上記以外 \end{align*} \right . \]  検定は,次式の $Z$ が近似的に正規分布従うことを利用する。

\[ Z = \frac{W}{\sqrt{Var{W}}} \]  なお,上述の分散の定義は,Mantel( 1967 )によるものであるが,Gehan( 1965 )は結果は同じになるが別の定義を示している( 青木ら( 1978 )にも紹介記事がある )。

参考文献

  1. 青木繁伸, 開原成允: 生命表による生存曲線の解析 - - 医学統計学最近の話題( 2 ). 医学のあゆみ, 104 ( 9 ) , 587 - 592, 1978.

  2. Gehan, E. A.: A generalized Wilcoxon test for comparing arbitrarily singly-censored samples. Biometrika, 52 , 203 - 223, 1965.

  3. Mantel, N.: Ranking procedures for arbitrarily restricted observations. Biometrics, 23 , 65 - 78, 1967.


演習問題


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI