$2$ 個の変数 $A$,$B$ がそれぞれ $k$ 個,$m$ 個のカテゴリーを持つとしたとき,$k \times m$ 個の桝目を持つ集計表(相関関係を見るときには特に相関表ともいう)を作成する。
要因 B | ||||||||
---|---|---|---|---|---|---|---|---|
$B_{1}$ | $B_{2}$ | $\dots$ | $B_{j}$ | $\dots$ | $B_{m}$ | 合計 | ||
要因 A | $A_{1}$ | $O_{1j}$ | $n_{1 \cdot }$ | |||||
$A_{2}$ | $O_{2j}$ | $n_{2 \cdot }$ | ||||||
: | : | : | ||||||
$A_{i}$ | $O_{i1}$ | $O_{i2}$ | $\dots$ | $O_{ij}$ | $\dots$ | $O_{im}$ | $n_{i \cdot }$ | |
: | : | : | ||||||
$A_{k}$ | $O_{kj}$ | $n_{k \cdot }$ | ||||||
合計 | $n_{ \cdot 1}$ | $n_{ \cdot 2}$ | $\dots$ | $n_{ \cdot j}$ | $\dots$ | $n_{ \cdot m}$ | $n$ |
表 1 のような $k \times m$ 分割表で,変数 $A$ の第 $i$ カテゴリー,変数 $B$ の第 $j$ カテゴリーの観察値を $O_{ij}$ とする。また,$n_{i \cdot }$ を第 $i$ 行の合計,$n_{ \cdot j}$ を第 $j$ 列の合計とする。 \[ E_{ij} = n\ \left (\frac{n_{i\cdot}}{n}\ \frac{n_{\cdot j}}{n} \right )= \frac{n_{i\cdot}\ n_{\cdot j}} {n} \] 全ての桝目について $\displaystyle \frac{( O_{ij} - E_{ij} ) ^{2}}{E_{ij}}$ の合計をとったものを $\chi^2_0$ とする (これは,独立性の検定に使用される)。 \[ \chi^2_0 = \sum_{i=1}^k \sum_{j=1}^m \frac{\left (O_{ij}-E_{ij} \right)^2}{E_{ij}} \] $2$ 変数間の関連の強さは,$\chi^2_0$ から計算され,表 2 に示すようないくつかの指標がある。これらを総称して属性相関係数と呼ぶ。
$\phi$ 係数は分割表の大きさ $t = \min ( k , m ) $ により上限が異なるので,$t$ の異なる分割表の間で関連の強さの比較ができない。
これらの属性相関係数はいずれも $\chi^2$ 統計量に基づくものであり,有意性の検定は上述の独立性の検定($\chi^2$ 検定)の結果と等価である。
係数 | 定義 | 取る値の範囲 |
---|---|---|
$\phi$ | $\sqrt{\displaystyle \frac{\chi^2_0}{n}}$ | $0$ 〜 $\sqrt{t-1}$ |
$C$ | $\sqrt{\displaystyle \frac{\chi^2_0}{n+\chi^2_0}}$ | $0$ 〜 $\sqrt{\displaystyle \frac{t-1}{t}}$ |
$V$ | $\displaystyle \frac{\phi}{\sqrt{t-1}}$ | $0$ 〜 $1$ |
$t = \min ( k , m ) $ | ||
演習問題:
「表 3 に示す分割表において,$\phi$ 係数,コンティンジェンシー係数,クラメール係数を求めなさい。」
$y_{1}$ | $y_{2}$ | $y_{3}$ | 合計 | |
---|---|---|---|---|
$x_{1}$ | 5 | 7 | 19 | 31 |
$x_{2}$ | 9 | 11 | 4 | 24 |
$x_{3}$ | 15 | 10 | 1 | 26 |
合計 | 29 | 28 | 24 | 81 |
問題1 $\chi^2_0$ を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題2 $\phi$ 係数を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題3 コンティンジェンシー係数 $C$ を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題4 クラメール係数 $V$ を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
応用問題: