マハラノビスの平方距離  Last modified: Jan 13, 2006

 マハラノビスの平方距離に基づき,距離の近い群に判別するということを,架空例で見てみよう。

表 1. 2群,2変量データ
data
 2 群のデータを考える。各群 10 組の2 変数データとする。データは表 1 の通り。
 第 2 群のデータは,第 1 群のデータを (100, 50) だけ平行移動したものである。
 第 1 群の平均値は (59, 64),第 2 群の平均値は (159, 114) である。

表 2. 変動・共変動の計算
variation
 変動・共変動の計算は,表 2 のようになる。第 1 群と第 2 群の分散・共分散行列は全く等しいことに注意。
 分散・共分散行列および,その逆行列を計算する。

図 1. マハラノビスの平方距離の計算例
mahalanobis
 マハラノビスの平方距離は,分散共分散行列の逆行列を用いて計算する。
 第 1 群の 10 番目の例 (111, 134) について,各群の重心までマハラノビスの平方距離の計算例を図 1 に示す。

図 2. マハラノビスの平方距離とユークリッド距離の関係
fig
 この結果を図 2 に示す。ユークリッド距離では,緑で描いた線分は紫で描いた線分より長い(距離が長い)。しかし,第 1 群の重心までのマハラノビス距離は 3.53,第 2 群の重心までのマハラノビス距離は 13.03 である。その理由は,各群のデータは楕円で示したような二次元(正規分布)をしているので,ユークリッド距離的に楕円の長軸方向と短軸方向へ同じだけ離れた点までのマハラノビス距離は異なるのである(短軸方向の距離の方が長い)。
 それぞれのデータが各グループに属する確率は,マハラノビスの平方距離が自由度 $p$ のカイ二乗分布に従うことに基づいて計算できる($p$ は判別分析に用いた変数の個数)。
 第 1 群の 10 番目の例 (111, 134) は,第 1 群までの平方距離が 3.528831972,第 2 群までの平方距離が 13.02910706 であり,p = 2 であるから,各群に属する確率はそれぞれ CHIDIST(3.528831972,2)=0.1712867911712320,CHIDIST(13.02910706,2)=0.0014817172941941 となる。


このデータを判別分析した結果例を以下に示す。

★ 平均値
                      全体        第1群        第2群
                  20ケース      10ケース      10ケース
  2 Var002        109.0000      59.00000      159.0000
  3 Var003        89.00000      64.00000      114.0000

★ 判別関数

                 判別係数       標準化判別係数
  2 Var002       -0.21312         -12.43133
  3 Var003        0.11503           4.99000
    定数項       12.99238

★ 各ケースの判別結果

ケース  R     P      平方距離1      平方距離2       判別値
     1  1     1      2.75(0.253)    27.59(0.000)    12.42079
     2  1     1      0.97(0.616)    20.61(0.000)     9.81963
     3  1     1      3.07(0.216)    10.15(0.006)     3.54106
     4  1     1      2.06(0.357)    28.76(0.000)    13.35170
     5  1     1      0.01(0.993)    15.51(0.000)     7.74637
     6  1     1      1.25(0.536)     8.67(0.013)     3.71402
     7  1     1      0.12(0.940)    14.41(0.001)     7.14444
     8  1     1      2.74(0.254)    26.91(0.000)    12.08365
     9  1     1      1.50(0.473)     7.96(0.019)     3.23069
    10  1     1      3.53(0.171)    13.03(0.001)     4.75014  図 1 の計算例に示したもの
    11  2     2      9.03(0.011)     2.75(0.253)    -3.13971
    12  2     2     12.45(0.002)     0.97(0.616)    -5.74086
    13  2     2     27.11(0.000)     3.07(0.216)   -12.01944
    14  2     2      6.48(0.039)     2.06(0.357)    -2.20880
    15  2     2     15.64(0.000)     0.01(0.993)    -7.81413
    16  2     2     24.94(0.000)     1.25(0.536)   -11.84647
    17  2     2     16.96(0.000)     0.12(0.940)    -8.41605
    18  2     2      9.70(0.008)     2.74(0.254)    -3.47685
    19  2     2     26.16(0.000)     1.50(0.473)   -12.32981
    20  2     2     25.15(0.000)     3.53(0.171)   -10.81036

    注:‘平方距離'は各群の重心までのマハラノビスの平方距離
        カッコ内は各群に属する確率

★ 判別結果

              判別された群
実際の群     第1群  第2群    合計
  第1群         10       0      10
      %     (100.0) (  0.0) (100.0)
  第2群          0      10      10
      %     (  0.0) (100.0) (100.0)

                 正判別率 ・・・ 100.00%


・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI

Made with Macintosh