★ 多次元正規分布の下で,ある範囲に落ちる確率 ★

 108 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/28 (金) 15:55
  109 Re: 多次元正規分布の下で,ある範囲に落ちる確率  青木繁伸  2000/01/28 (金) 19:56
   161 Re^2: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/31 (月) 14:11
    163 Re^3: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/31 (月) 14:13
     214 Re^4: 多次元正規分布の下で,ある範囲に落ちる確率  青木繁伸  2000/02/02 (水) 12:58
      217 Re^5: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/02/02 (水) 15:00


108. 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/28 (金) 15:55
Yahoo で検索してこのページを見つけました。すばらしいですね。
様々なトピックに関してていねいに説明してあるので,大変参考になりました。

ところで,1つ教えて下さい。1次元の正規分布では,μ±1σの範囲に 68.26%,μ±2σの範囲に95.44%, μ±3σの範囲に99.74%のデータが含まれているのは分かるのですが,多次元の正規分布の場合,マハラノビス距離を決めると,その範囲内に落ちる確率は共分散行列によらず,一定に決まるのでしょうか。
もしそうだとすると,2, 3, 4 次元の場合,マハラノビス距離 1, 2, 3 以内に落ちる確率は具体的にいくつになるのでしょうか。どうやって計算するのでしょう。

     [このページのトップへ]


109. Re: 多次元正規分布の下で,ある範囲に落ちる確率  青木繁伸  2000/01/28 (金) 19:56
> 多次元の正規分布の場合,マハラノビス距離を決めると,その範囲内に落ちる確率は共分散行列によらず,一定に決まるのでしょうか。

「共分散行列によらず」というのはどういう意味ですか?
マハラノビス距離は共分散行列によりますからね。

それはともかく,マハラノビス距離がわかれば,一意に決まります。
つまり,あるデータ点とデータの平均値間のマハラノビス距離は,「次元数」を自由度とするカイ二乗分布に従います。

> もしそうだとすると,2, 3, 4 次元の場合,マハラノビス距離 1, 2, 3 以内に落ちる確率は具体的にいくつになるのでしょうか。どうやって計算するのでしょう。

例えばエクセルで,
chidist(マハラノビス距離,次元数)
ということで,そのデータ点がその分布に属する確率が求まります。

     [このページのトップへ]


161. Re^2: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/31 (月) 14:11
どうもありがとうございます。合点がいきました。

> > 多次元の正規分布の場合,マハラノビス距離を決めると,その範囲内に落ちる確率は共分散行列によらず,一定に決まるのでしょうか。

> 「共分散行列によらず」というのはどういう意味ですか?
> マハラノビス距離は共分散行列によりますからね。

失礼しました,言葉が足りませんでした。まず次元を決め,平均と共分散行列を決めると多次元の正規分布が決まります。それに依存してマハラノビス距離が決まります。マハラノビス距離が一定値 d0 以内に落ちる確率を P(d <= d0) と書くと,この値自体は,もとの正規分布を決定づける共分散行列の設定がどうあろうとも,それに依存せず,次元数と d0 だけで決まる,という認識は正しいのでしょうか,と聞きたかったわけです。どうやらそのようですね。

(つづく)

     [このページのトップへ]


163. Re^3: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/01/31 (月) 14:13
(つづき)

> > もしそうだとすると,2, 3, 4 次元の場合,マハラノビス距離 1, 2, 3 以内に落ちる確率は具体的にいくつになるのでしょうか。どうやって計算するのでしょう。

> 例えばエクセルで,
> chidist(マハラノビス距離,次元数)
> ということで,そのデータ点がその分布に属する確率が求まります。

やってみました。一方,Mathematica で書くと,
Needs["Statistics`NormalDistribution`"]
n = 3 (* 次元 *)
d = 4 (* マハラノビス距離 *)
Integrate[PDF[ChiSquareDistribution[n], x], {x, 0, d}]
こんな感じですね。

ちょっと細かいことですが,マハラノビス距離というのは,

d^2 = (x_i - μ)' Σ^(-1) (x_i - μ)

という定義式における,(d のことではなくて) d^2 そのものを指すのでしょうか。

     [このページのトップへ]


214. Re^4: 多次元正規分布の下で,ある範囲に落ちる確率  青木繁伸  2000/02/02 (水) 12:58
> ちょっと細かいことですが,マハラノビス距離というのは,
>
> d^2 = (x_i - μ)' Σ^(-1) (x_i - μ)
>
> という定義式における,(d のことではなくて) d^2 そのものを指すのでしょうか。

そうです。
ユークリッド距離にも,ユークリッドの二乗距離というのがあるので,正しく言えば「マハラノビスの二乗距離」と言うべきかもしれませんが,d^2 の方がよく使われるので,これをマハラノビスの距離と呼ぶことが多いようです。

     [このページのトップへ]


217. Re^5: 多次元正規分布の下で,ある範囲に落ちる確率  ぼきゃ偏  2000/02/02 (水) 15:00
ご多忙の中,リプライどうもありがとうございます。

# それにしても,この掲示板,ものすごい勢いで書き込まれていきますね。

> > ちょっと細かいことですが,マハラノビス距離というのは,
> >
> > d^2 = (x_i - μ)' Σ^(-1) (x_i - μ)
> >
> > という定義式における,(d のことではなくて) d^2 そのものを指すのでしょうか。
>
> そうです。
> ユークリッド距離にも,ユークリッドの二乗距離というのがあるので,正しく言えば「マハラノビスの二乗距離」と言うべきかもしれませんが,d^2 の方がよく使われるので,これをマハラノビスの距離と呼ぶことが多いようです。

分かりました。慣習ということのようですね。

いちおうこの件,一段落させていただきたいと思います。どうもありがとうございました。また何かあったときはよろしくお願いします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 006 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る