二人の評定者の判定結果がどの程度一致しているかを表す指標と,一致率に関する検定と推定を行う。
例題:
「二人の評定者が判定した結果が表 1 のようにまとめられた。評定が同じかどうか検定しなさい。」
評定者B | |||||
---|---|---|---|---|---|
$B_{1}$ | $B_{2}$ | $B_{3}$ | 合計 | ||
評定者A | $A_{1}$ | 12 | 6 | 1 | 19 |
$A_{2}$ | 3 | 19 | 4 | 26 | |
$A_{3}$ | 2 | 5 | 34 | 41 | |
合計 | 17 | 30 | 39 | 86 |
検定手順:
評定者B | ||||||
---|---|---|---|---|---|---|
$B_{1}$ | $B_{2}$ | $\dots$ | $B_{k}$ | 合計 | ||
評定者A | $A_{1}$ | $O_{11}$ | $O_{12}$ | $\dots$ | $O_{1k}$ | $O_{1\cdot}$ |
$A_{2}$ | $O_{21}$ | $O_{22}$ | $\dots$ | $O_{2k}$ | $O_{2\cdot}$ | |
: | : | : | $\dots$ | : | : | |
$A_{k}$ | $O_{k1}$ | $O_{k2}$ | $\dots$ | $O_{kk}$ | $O_{k\cdot}$ | |
合計 | $O_{\cdot1}$ | $O_{\cdot2}$ | $\dots$ | $O_{\cdot k}$ | $n$ |
評定者B | ||||||
---|---|---|---|---|---|---|
$B_{1}$ | $B_{2}$ | $\dots$ | $B_{k}$ | 合計 | ||
評定者A | $A_{1}$ | $E_{11}$ | $E_{12}$ | $\dots$ | $E_{1k}$ | $E_{1\cdot}$ |
$A_{2}$ | $E_{21}$ | $E_{22}$ | $\dots$ | $E_{2k}$ | $E_{2\cdot}$ | |
: | : | : | $\dots$ | : | : | |
$A_{k}$ | $E_{k1}$ | $E_{k2}$ | $\dots$ | $E_{kk}$ | $E_{k\cdot}$ | |
合計 | $E_{\cdot1}$ | $E_{\cdot2}$ | $\dots$ | $E_{\cdot k}$ | $n$ |
例題では,$E_{11}=\displaystyle \frac{17\cdot19}{86}=3.756$,$E_{22}=\displaystyle \frac{30\cdot26}{86}=9.070$,$E_{33}=\displaystyle \frac{39\cdot41}{86}=18.593$ となる。
評定者B | |||||
---|---|---|---|---|---|
$B_{1}$ | $B_{2}$ | $B_{3}$ | 合計 | ||
評定者A | $A_{1}$ | 3.756 | 6.628 | 8.616 | 19 |
$A_{2}$ | 5.140 | 9.070 | 11.791 | 26 | |
$A_{3}$ | 8.105 | 14.302 | 18.593 | 41 | |
合計 | 17 | 30 | 39 | 86 |
例題では,$P \lt 0.0001$ である。
例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \lt \alpha$ であるから,帰無仮説を棄却する。すなわち,「評定結果は一致している」という結論になる。
重み付け $\kappa$ 統計量
もし,評定者 A が $1$ と評定し評定者 B が $2$ と評定した場合と,評定者 A が $1$ と評定し評定者 B が $3$ と評定した場合には,不一致の程度が異なると考える場合には,より不一致であると考える桝目の重みを大きくすればよい。
各桝目の重みを $W_{ij} \ ( W_{ii} = 0, W_{ij} \gt 0 )$ としたときは,重み付け $\kappa$ 統計量は以下のように定義される。 \[ \begin{align*} Q_{ow} & = \frac{\displaystyle \sum_{i=1}^k \sum_{j=1}^k W_{ij}\ O_{ij}} {n}, \ \ \ \ \ Q_{ow^2} = \frac{\displaystyle \sum_{i=1}^k \sum_{j=1}^k W_{ij}^2\ O_{ij}} {n} \\[5pt] Q_{ew} & = \frac{\displaystyle \sum_{i=1}^k \sum_{j=1}^k W_{ij}\ E_{ij}} {n}, \ \ \ \ \ Q_{ew^2} = \frac{\displaystyle \sum_{i=1}^k \sum_{j=1}^k W_{ij}^2\ E_{ij}} {n} \\[5pt] k_w & = 1-\frac{Q_{ow}}{Q_{ew}} \\[5pt] \sigma_{\kappa_w} & = \sqrt{\frac{Q_{ow^2} - Q_{ow}^2}{n\ Q_{ew}^2}} \\[5pt] \sigma_{\kappa_{w_0}} & = \sqrt{\frac{Q_{ew^2} - Q_{ew}^2}{n\ Q_{ew}^2}} \end{align*} \]
例題では,表 5 のような重みを付けて解析してみた。結果は以下の通り。
|
κw ・・・・・・・・・・ 0.6932629 sigmaκw ・・・・・・・・ 0.0686574 sigmaκw0 ・・・・・・・ 0.1126106 Z値 ・・・・・・・・・ 6.1562841 有意確率 ・・・・・ < 0.0000001 ** 95%信頼区間 [ 0.558697 , 0.827829 ] |
演習問題:
応用問題: