ケンドールの順位相関係数 Last modified: Sep 02, 2003
例題:
「表 1 において,変数 $X$ と変数 $Y$ の間のケンドールの順位相関係数を求めなさい。」
表 1.二変数データ
$i$ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
変数 $X_{i}$ | 2.8 | 3.4 | 3.6 | 5.8 | 7.0 | 9.5 | 10.2 | 12.3 | 13.2 | 13.4 |
変数 $Y_{i}$ | 0.6 | 3.0 | 0.4 | 1.5 | 15.0 | 13.4 | 7.6 | 19.8 | 18.3 | 18.9 |
計算手順:
- ケース数を $n$ とする。
- 変数 $X$ と変数 $Y$ について小さい方から順位をつけ,変数 $X$ について小さい順に並べ変える(同順位の場合には平均順位をつける)。
- $Y_{i}\ (i = 1, 2, \dots , n - 1)$ について,$Y_{i} \lt Y_{j}$ の個数を $P_{i}$ ,$Y_{i} \gt Y_{j}$ の個数を $Q_{i}$ とする$(j = i + 1, i + 2, \dots , n)$。
例えば,表 2 に示すように,$X_{5}$ に対する $Y$ の順位は $7$ であり,それより右にある $Y$ の順位のうち,大きいものは $Y_{8}, Y_{9}, Y_{10}$ の $3$ 個($P_{5} = 3$),小さいものは $Y_{6}, Y_{7}$ の $2$ 個($Q_{5} = 2$)。
$P_{i} + Q_{i} = n - i$,$\sum ( P_{i} + Q_{i} ) = \displaystyle \frac{n\ ( n - 1 )}{2}$ となることに注意。
- $\sum P_{i}$ は $2$ 変数の順位の方向が一致する回数,$\sum Q_{i}$ は $2$ 変数の順位の方向が逆方向に一致する回数なので,$\sum P_{i} - \sum Q_{i}$ は順序の一致性の指標である。
- $2$ 変数の順序が完全に一致するときには,$\sum P_{i} =\displaystyle \frac{n\ (n-1)}{2}$,$\sum Q_{i} = 0$ である。
- $2$ 変数の順序が逆順に完全に一致するときには,$\sum P_{i} = 0$,$\sum Q_{i} = \displaystyle \frac{n\ (n-1)}{2}$ である。
このようなことから,$(1)$ 式を定義すれば, $- 1 \leqq r_{k} \leqq 1$ となる。これがケンドールの順位相関係数である。
\[
r_k = \frac{\displaystyle \sum_{i=1}^{n-1} P_i - \sum_{i=1}^{n-1} Q_i} {\displaystyle \frac{n\ (n-1)}{2}} \tag{1}
\]
例題では,$\sum P_{i} = 37$,$\sum Q_{i} = 8$ なので,$\displaystyle r_{k} = \frac{37 - 8 }{ 10\cdot 9\ /\ 2 } = 0.64444$ となる。
- 相関係数が正の場合「二変数には正の相関関係がある」という(正相関)
- 相関係数が負の場合「二変数には負の相関関係がある」という(負相関)
- 相関係数が $0$ に近いとき「二変数は無相関である」という
表 2.ケンドールの順位相関係数の計算例
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
変数 $X_{i}$ の順位 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
変数 $Y_{i}$ の順位 | 2 | 4 | 1 | 3 | 7 | 6 | 5 | 10 | 8 | 9 |
$P_{i}$ | 8 | 6 | 7 | 6 | 3 | 3 | 3 | 0 | 1 | | $\sum P_{i} = 37$ |
$Q_{i}$ | 1 | 2 | 0 | 0 | 2 | 1 | 0 | 2 | 0 | | $\sum Q_{i} = 8$ |
$P_{i}+Q_{i}$ | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | | $\sum ( P_{i} + Q_{i} ) = 45$ |
注:
- どちらか一方(または両方)の変数において全てのケースが同一の値をとる場合には,相関係数は定義できない。
- 同順位がある場合には,変数 X,変数 $Y$における同順位の個数を $n_{x}$ ,$n_{y}$ ,同順位の大きさを $t_{i}, t_{j}\ (i = 1, 2, \dots , n_{x};\ j = 1, 2, \dots , n_{y} )$ としたとき,次式で計算される。同順位がない場合には $T_{x} = T_{y} = 0$ となり,$(1)$ 式に等しい。
\[
\begin{align*}
& r_k = \frac{\displaystyle \sum_{i=1}^{n-1} P_i - \sum_{i=1}^{n-1} Q_i} {\displaystyle \sqrt{\frac{n\ (n-1)}{2}-T_x}\ \sqrt{\frac{n\ (n-1)}{2}-T_y}} \tag{1} \\
& T_x = \sum_{i=1}^{n_x}\frac{t_i\ (t_i-1)}{2} \tag{2} \\
& T_y = \sum_{j=1}^{n_y}\frac{t_j\ (t_j-1)}{2} \tag{3} \\
\end{align*}
\]
注意:上の定義では,変数 $X$と変数 $Y$のいずれかに(両方に)同順位があるかで取り扱いが曖昧になることがある。
そこで,ケンドールの順位相関係数のもう一つの定義法を示しておく(同順位がない場合は同じ結果が得られる。また,この方法では順位付けをする必要はない)。
変数の組 $( X_{i}, Y_{i} )$と $( X_{j}, Y_{j} )$ を考える( $i \ne j$ )。
- $X_{i} \gt X_{j}$ かつ $Y_{i} \gt Y_{j}$ のとき $P_{ij} = 1$
- $X_{i} \lt X_{j}$ かつ $Y_{i} \lt Y_{j}$ のとき $P_{ij} = 1$
- $X_{i} \gt X_{j}$ かつ $Y_{i} \lt Y_{j}$ のとき $Q_{ij} = 1$
- $X_{i} \lt X_{j}$ かつ $Y_{i} \gt Y_{j}$ のとき $Q_{ij} = 1$
として,$\sum P_{ij} - \sum Q_{ij}$ を求める。
- 同順位がないとき
\[
r_k = \frac{\sum P_{ij} - \sum Q_{ij}}{n\ (n-1)}
\]
- 同順位があるとき
\[
r_k = \frac{\displaystyle \frac{\sum P_{ij} - \sum Q_{ij}}{2}} {\displaystyle \sqrt{\frac{n\ (n-1)}{2}-T_x}\ \sqrt{\frac{n\ (n-1)}{2}-T_y}}
\]
$T_{x}$ , $T_{y}$ は $(2)$,$(3)$ 式の通り。
演習問題:
「表 3 において,変数 $X$ と変数 $Y$ の間のケンドールの順位相関係数を求めなさい。」
表 3.二変数データ
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
変数 $X_{i}$ | 2 | 3 | 3 | 5 | 7 | 9 | 10 | 12 | 13 | 13 |
変数 $Y_{i}$ | 0 | 3 | 0 | 1 | 15 | 13 | 7 | 19 | 18 | 18 |
問題1 $T_{x}$ を求め解答欄に記入し,送信ボタンをクリックしなさい。
問題2 $\sum P_{ij} - \sum Q_{ij}$ を求め解答欄に記入し,送信ボタンをクリックしなさい。
問題3 $r_{k}$ を求めなさい。答えは小数点以下 5 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
応用問題:
直前のページへ戻る E-mail to Shigenobu AOKI