判別分析の目的は,いくつかの変数に基づいて,各データがどの群に所属するかを判定することである。
単純にするために,データが 2 つの群に分けられており,それぞれ 2 個の変数 $x_{1}$,$x_{2}$ の値が観察されているとする。
$x_{1}$ あるいは $x_{2}$ においてデータの分布を描くと,図 1 のように 2 群が重なる部分が大きいことがわかる。
ここで図に示したような座標軸 $f$ を考えると,各データがこの座標軸上でとる値は, \[ f = a\ x_{1} + b\ x_{2} \] のように合成変数の形になることがわかる。
図 1.判別分析の概念図 |
---|
座標軸 $f$ 上でのデータの分布を描くと,各群の重なる部分が小さくなることがわかる。これは,座標軸 $f$ 上で,ある値より大きい値であるか小さい値であるかによって,そのデータがいずれの群に属するかを判定できることを意味する。
演習問題:
応用問題: