★ マハラノビスの平方距離(定義,分布) ★

 359 マハラノビスの平方距離(定義,分布)  motoe  2003/02/13 (木) 14:50
  360 Re: マハラノビスの平方距離(定義,分布)  青木繁伸  2003/02/13 (木) 16:21
   362 Re^2: マハラノビスの平方距離(定義,分布)  motoe  2003/02/13 (木) 18:08
    395 Re^3: マハラノビスの平方距離(定義,分布)  もと  2003/02/19 (水) 14:38
     400 Re^4: マハラノビスの平方距離(定義,分布)     2003/02/19 (水) 20:24
      401 Re^5: マハラノビスの平方距離(定義,分布)  もと  2003/02/20 (木) 09:25


359. マハラノビスの平方距離(定義,分布)  motoe  2003/02/13 (木) 14:50
はじめての質問です。よろしくお願いします。
マハラノビス距離の定義については以下の2種類あるようです。
(定義1)
特に基準空間を設定しない定義
D^2={z-E[z]}^T・[S]^(-1)・{z-E[z]}・・(式1)

(定義2)
D^2={x-E[x]}^T・[R]^(-1)・{x-E[x]}/k(式2)
この定義ではマハラノビス平方距離の平均値は1になる。
ここで 
E[・]:平均, {z}:生データのコラムベクトル,
[S]:分散共分散行列,T:転置記号,[R]:相関係数行列,
{x}:基準化されたデータのコラムベクトル,k:変量の数
[R]:相関係数行列,k:変量の数

[1] ある群に属するデータの(定義1)の距離の分布は
  自由度が変量の数pのχ^2分布に従う。
  そうするとp=2の時,マハラノビス平方距離D^2の平方根Dが
 3.4以上では0.27%でありその群に属さないと判定できる。
  この考えでよろしいですか?

[2] ある群に属するデータの(定義2)の距離の分布は
 (定義1)と比較してどのように変わるのでしょうか?

     [このページのトップへ]


360. Re: マハラノビスの平方距離(定義,分布)  青木繁伸  2003/02/13 (木) 16:21
> [1] ある群に属するデータの(定義1)の距離の分布は
>   自由度が変量の数pのχ^2分布に従う。
>   そうするとp=2の時,マハラノビス平方距離D^2の平方根Dが
>  3.4以上では0.27%でありその群に属さないと判定できる。
>   この考えでよろしいですか?
Pr{χ^2>3.4^2} = chidist(3.4^2, 2) = 0.003088715 でしょうか

     [このページのトップへ]


362. Re^2: マハラノビスの平方距離(定義,分布)  motoe  2003/02/13 (木) 18:08
> >   そうするとp=2の時,マハラノビス平方距離D^2の平方根Dが
> >  3.4以上では0.27%でありその群に属さないと判定できる。
> >   この考えでよろしいですか?
> Pr{χ^2>3.4^2} = chidist(3.4^2, 2) = 0.003088715 でしょう

早速の回答有難うございます.その通りです.
   α=1-(normsdist(3)-0.5)*2=0.0027
  chiinv(α,2)=11.829 ,sqrt(11.829)=3.43
 この考えでよければ,その群に属さない確率は
 Pr(χ^2>定義2でのマハラノビス平方距離*変量の数,自由度:変数の数)
でよいと思います。如何でしょうか?
 また,定義1でのマハラノビス平方距離は定義2のそれの変量数倍になることを
数値例で確認しました.
 群1と群2の母集団を対象として,ある標本を別の集団であると判定する誤判断の確率は,定義1のマハラノビス平方距離をD^2とすると,2変量の場合sqrt(D^2)/2は
標準正規分布N(0,1)に従うとありました。これでよろしいですか?

     [このページのトップへ]


395. Re^3: マハラノビスの平方距離(定義,分布)  もと  2003/02/19 (水) 14:38
 いろいろ調べてみました。

> その群に属さない確率は
>  Pr(χ^2>定義2でのマハラノビス平方距離*変量の数,自由度:変数の数)
> でよいと思います。〜 〜 定義1でのマハラノビス平方距離は定義2のそれの
> 変量数倍になることを数値例で確認しました.

 マハラノビス汎距離の定義は2種類あり,一般統計学での定義とタグチメソッドでのそれでは変数の数だけ異なる。したがってその群に含まれる確率の計算にも注意が必要となる,が結論となりました.

>  群1と群2の母集団を対象として,〜 〜 誤判断の確率は,2変量の場合 標準正規分布N(0,1)に従うとありました。これでよろしいですか?

 群1と群2の重心間のマハラノビス平方距離D^2とすると,群内の分布を正規分布と仮定すると誤判断の確率はProb(u>D/2)で書けることも確認した。
 奥野忠一ほか著の「工業における多変量データ解析」日科技連(1986/06刊)\4,600は実例を挙げかつQ&Aを設け,実に痒いところに手の届く書籍であった.なお八重洲BCで入手した。

     [このページのトップへ]


400. Re^4: マハラノビスの平方距離(定義,分布)     2003/02/19 (水) 20:24
>  マハラノビス汎距離の定義は2種類あり,一般統計学での定義とタグチメソッドでのそれでは変数の数だけ異なる。したがってその群に含まれる確率の計算にも注意が必要となる,が結論となりました.

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc005/208.html
に,関連するスレッドがあるように思います。

     [このページのトップへ]


401. Re^5: マハラノビスの平方距離(定義,分布)  もと  2003/02/20 (木) 09:25
> http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc005/208.html
> に関連するスレッドあり

目を通したが特に得るものはなし。

(引用開始) 
● MTS タグチはあの田口玄一氏です。#なんかこういう名前をつけるって,他人事ながら恥ずかしい。
マハラノビス距離の計算で,最後に変数の個数で割っている。これでは,マハラノビスの距離のメリットは半減・・ 
マハラノビスの距離は自由度が「変数の個数」のカイ二乗分布に従うので,その個体が群に属する確率を求めることができるのに。変数の個数で割ったためにこの重要な性質を使えない(まさか気づいていないとか)ので,「修正(?)マハラノビス距離が3〜4以上なら群に属さない」などという記述に・・
(引用終了)

**コメント**
(1)提案方法の名前は本人が進んで命名するものもあるが,周りの人が命名する
  ケースが多い。
(2)変数の数で割るとマハラノビス汎距離の平均値は1となる。
(3)Pr(χ2>MTS流のマハラノビス汎距離*変数の数,変数の数)で済むので問題
  なく計算でき,群に属する確率は定量的に求めうる。
(4)手法を批判する時は著者の原典かそれに近いもので検討されることを勧める。
 以上

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 023 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る