この検定は,打ち切り例のない場合の Wilcoxon 検定( マン・ホイットニーの $U$ 検定と等価 )の拡張である。
2 群の生存時間の長さに差があるかどうかを検定する。
A 群と B 群の全ケース数を $n_a$,$n_b$ とする。A 群,B 群の生存時間を $X_{i}$,$Y_{j}$,打ち切り例については $X_{i}'$,$Y_{j}'$ とする( $i = 1, 2, \dots , n_a\ ;\ j = 1, 2, \dots , n_b$ )。
両群の生存時間を比較するとき,以下のような検定統計量を定義する。
\[ W = \sum_{i=1}^{n_a} \sum_{j=1}^{n_b} U_{ij} \] ただし,
\[ U_{ij} = \left \{ \begin{align*} -1 &, X_i \lt Y_j\ または\ X_i \leqq Y_j' \\ +1 &, X_i \gt Y_j\ または\ X_i' \geqq Y_j \\ 0 &, 上記以外 \end{align*} \right . \] である。すなわち,生存時間の大小比較において,一方が打ち切り例のとき,例えば $X_{i}$ と $Y_{j}'$ の比較において,もし $X_{i} = Y_{j}'$ であった場合にも,$Y_{j}' = Y_{j} + \alpha \gt Y_{j} \gt X_{i}$ であると考える点が「一般化」の意味するところである。
検定統計量 $W$ の平均値は 0,分散 $Var ( W )$ は次式のようになる。
\[ Var(W) = \frac{n_a\ n_b}{(n_a+n_b)\ (n_a+n_b-1)}\ \sum_{i=1}^{n_a+n_b} \left ( \sum_{j=1}^{n_a+n_b} H_{ij} \right ) ^2 \] ただし,$H_{ij}$ は上述の $U_{ij}$ の定義のしかたに準ずるが,2 群のケースをひとまとめにして,生存時間を $X_{i}$,$Y_{j}$,打ち切り例については $X_{i}'$,$Y_{j}'\ ( i, j = 1, 2, \dots , n_a + n_b)$ として,以下のように定義される。
\[ H_{ij} = \left \{ \begin{align*} -1 &, X_i \lt Y_j\ または\ X_i \leqq Y_j' \\ +1 &, X_i \gt Y_j\ または\ X_i' \geqq Y_j \\ 0 &, 上記以外 \end{align*} \right . \] 検定は,次式の $Z$ が近似的に正規分布従うことを利用する。
\[ Z = \frac{W}{\sqrt{Var{W}}} \] なお,上述の分散の定義は,Mantel( 1967 )によるものであるが,Gehan( 1965 )は結果は同じになるが別の定義を示している( 青木ら( 1978 )にも紹介記事がある )。
参考文献
演習問題:
応用問題: