★ 判別分析の各群に属する確率について ★

8977. 判別分析の各群に属する確率について あきた 2006/01/12 (木) 16:24
└8978. Re: 判別分析の各群に属する確率について 青木繁伸 2006/01/12 (木) 17:28
 └8994. Re^2: 判別分析の各群に属する確率について あきた 2006/01/13 (金) 09:37
  └9006. Re^3: 判別分析の各群に属する確率について あきた 2006/01/13 (金) 12:42
   └9008. Re^4: 判別分析の各群に属する確率について 青木繁伸 2006/01/13 (金) 13:03
    ├9232. Re^5: 判別分析の各群に属する確率について あきた 2006/01/26 (木) 10:51
    │└9234. Re^6: 判別分析の各群に属する確率について 青木繁伸 2006/01/26 (木) 14:01
    │ └9235. Re^7: 判別分析の各群に属する確率について あきた 2006/01/26 (木) 14:12
    └9016. Re^5: 判別分析の各群に属する確率について あきた 2006/01/13 (金) 14:03
     └9019. Re^6: 判別分析の各群に属する確率について 青木繁伸 2006/01/13 (金) 14:42
      └9020. Re^7: 判別分析の各群に属する確率について あきた 2006/01/13 (金) 14:58
       └9064. Re^8: 判別分析の各群に属する確率について あきた 2006/01/16 (月) 13:36
        └9067. Re^9: 判別分析の各群に属する確率について 青木繁伸 2006/01/16 (月) 14:27
         ├9188. Re^10: 判別分析の各群に属する確率について さくら 2006/01/24 (火) 13:20
         │└9190. Re^11: 判別分析の各群に属する確率について 青木繁伸 2006/01/24 (火) 13:49
         │ └9193. Re^12: 判別分析の各群に属する確率について さくら 2006/01/24 (火) 14:25
         └9071. Re^10: 判別分析の各群に属する確率について あきた 2006/01/16 (月) 15:03


8977. 判別分析の各群に属する確率について あきた  2006/01/12 (木) 16:24
はじめまして.
統計学の初心者で,急に必要となり勉強をはじめたものです.

現在,多群の判別分析を利用しようとしています.
相等性の検定を行い,その結果をふまえて,2次の判別関数で実施していますが,その際に各群に属する確率をどのように計算したら良いか教えていただけないでしょうか.
線形判別関数の場合については,書籍などで確認できたのですが,同じ方法で良いのでしょうか.
本当に初歩的な質問で申し訳ありません.
よろしくお願いします.

     [このページのトップへ]


8978. Re: 判別分析の各群に属する確率について 青木繁伸  2006/01/12 (木) 17:28
同じ方法です。
二次の判別の場合には,マハラノビスの二乗距離を計算する際にグループ毎の分散共分散行列がを使うだけですから。マハラノビス距離とカイ二乗分布の関連は同じです。

     [このページのトップへ]


8994. Re^2: 判別分析の各群に属する確率について あきた  2006/01/13 (金) 09:37
少しわかりにくいのですが,
以下のようなイメージですね.

グループKに属する確率
e^(-1/2*D)/[(2π^p/2)*SQRT(S)]
D:グループKの重心からのマハラノビス汎距離
S:グループKの分散共分散行列
↑線形判別関数の場合は,プール後の分散共分散行列

どうもありがとうございました.

     [このページのトップへ]


9006. Re^3: 判別分析の各群に属する確率について あきた  2006/01/13 (金) 12:42
たびたび申し訳ありません.

本サイトのBlack-Box上では各グループに属する確率は,どのように計算されているのでしょうか・・・
私の方で計算した結果と,サイトを利用したときの結果があわないので申し訳ありませんが,ご教授いただければ幸いです.
※マハラノビスの汎距離については計算結果は合致しました.

私のほうでは,以下の式で求めています.

  e^(-1/2*D)
-------------------
[(2π^p/2)*SQRT(S)]

D:グループKの重心からのマハラノビス汎距離
P:変数の数
S:グループKの分散共分散行列における行列式
 ↑線形判別関数の場合は,プール後の分散共分散行列

申し訳ありませんが,よろしくお願いします.

     [このページのトップへ]


9008. Re^4: 判別分析の各群に属する確率について 青木繁伸  2006/01/13 (金) 13:03
> 私のほうでは,以下の式で求めています.
>
>   e^(-1/2*D)
> -------------------
> [(2π^p/2)*SQRT(S)]
>
> D:グループKの重心からのマハラノビス汎距離
> P:変数の数
> S:グループKの分散共分散行列における行列式
>  ↑線形判別関数の場合は,プール後の分散共分散行列

http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/mahalanobis.html
は,ごらんになりましたか?

プログラム例は
http://aoki2.si.gunma-u.ac.jp/R/quad_disc.html
を見て頂くと良いかもしれませんが。

マハラノビスの平方距離が由度 p の χ2 分布に従うことを利用する(pは説明変数の個数)ということにつきるので,あきたさんの式があっているかどうか。。。その式は,何を求めるものですか?


     [このページのトップへ]


9232. Re^5: 判別分析の各群に属する確率について あきた  2006/01/26 (木) 10:51
> > 私のほうでは,以下の式で求めています.
> >
> >   e^(-1/2*D)
> > -------------------
> > [(2π^p/2)*SQRT(S)]
> >
> > D:グループKの重心からのマハラノビス汎距離
> > P:変数の数
> > S:グループKの分散共分散行列における行列式
> >  ↑線形判別関数の場合は,プール後の分散共分散行列
>
> http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/mahalanobis.html
> は,ごらんになりましたか?
>
> プログラム例は
> http://aoki2.si.gunma-u.ac.jp/R/quad_disc.html
> を見て頂くと良いかもしれませんが。
>
> マハラノビスの平方距離が由度 p の χ2 分布に従うことを利用する(pは説明変数の個数)ということにつきるので,あきたさんの式があっているかどうか。。。その式は,何を求めるものですか?


以前,教えていただきました上記の方法で各群に属する確率を求めております.

この方法についての参考文献を掲載しようと多変量解析に関する書籍をいろいろと探したところ,該当するものが見つかりませんでした.
※ほとんどが,各群に属する選択確率まで言及していません.
HPを掲載しても良いと思うのですが,古い考え方の方もおられ書籍で・・・と考えております.

マハラノビスの距離とχ2乗分布との関係を示した内容で
青木先生が参考にされている書籍などを紹介していただけないでしょうか.

誠に申し訳ありません.
※マハラノビスの距離とχ2乗分布との関係は一般常識なのかもしれませんが,勉強不足でその辺りがよくわかっておりません.

     [このページのトップへ]


9234. Re^6: 判別分析の各群に属する確率について 青木繁伸  2006/01/26 (木) 14:01
奥野忠一他「多変量解析法」日科技連
絶版かもしれない

そのほかにもいろいろあると思うが,探すのが面倒で

     [このページのトップへ]


9235. Re^7: 判別分析の各群に属する確率について あきた  2006/01/26 (木) 14:12
> 奥野忠一他「多変量解析法」日科技連
> 絶版かもしれない
>
> そのほかにもいろいろあると思うが,探すのが面倒で

すいません.ありがとうございました.

     [このページのトップへ]


9016. Re^5: 判別分析の各群に属する確率について あきた  2006/01/13 (金) 14:03
> マハラノビスの平方距離が由度 p の χ2 分布に従うことを利用する(pは説明変数の個数)ということにつきるので,あきたさんの式があっているかどうか。。。その式は,何を求めるものですか?

すいません.
サイトを見落としてました.
ありがとうございます.
※式については,ある書籍に載っていたものです.

あと1点質問なのですが,
特 定のサンプルが出てきたとき,どのグループに属するのか,確率を出したいと考えています.しかし,各グループの選択確率を加算しても1(100%)になり ません.そこで,全体の構成比を算出して,構成比の確率を”特定のサンプル”が各グループに属する確率と置き換えても問題ないでしょうか?

今回の場合,
グループA:0.009
グループB:0.079
グループC:0.003
グループD:0.058

これを,全体に占めるグループAの確率として次のように求めても良いのでしょうか.

0.009×100
--------------------------
0.009+0.079+0.003+0.058


まだまだ,勉強不足で理解度も低く,勘違いしている部分も多々あると思いますが,アドバイスいただければ幸いです.

     [このページのトップへ]


9019. Re^6: 判別分析の各群に属する確率について 青木繁伸  2006/01/13 (金) 14:42
> 特定のサンプルが出てきたとき,どのグループに属するのか,確率を出したいと考えています.しかし,各グループの選択確率を加算しても1(100%)になりません.

そういうものでしょう。
あなたのデータの場合には生じていないのかもしれませんが,確率を加えたら100%を超えることだってあるのです。

http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/disc2.html
の,9番目の項目に書いてあります。

> そこで,全体の構成比を算出して,構成比の確率を”特定のサンプル”が各グループに属する確率と置き換えても問題ないでしょうか?

そのように定義したということなら,断った上でそのようにするのは差し支えないかもしれませんが,本来の意味を失ってしまいますね。

     [このページのトップへ]


9020. Re^7: 判別分析の各群に属する確率について あきた  2006/01/13 (金) 14:58
> そのように定義したということなら,断った上でそのようにするのは差し支えないかもしれませんが,本来の意味を失ってしまいますね。

たしかに,本来の意味を失ってしまいますね.
この辺を考慮してもう少し考えてみます.
本当にありがとうございました.

     [このページのトップへ]


9064. Re^8: 判別分析の各群に属する確率について あきた  2006/01/16 (月) 13:36
青木先生にアドバイスいただき判別分析を行っております.

そこで,一点教えていただきたいのですが,
2次の判別の場合(マハラノビスの距離をつかって判別分析),
報告書・論文などには,一般的にどの数値を記すのが良いのでしょうか?

初歩的な質問で申し訳ありません.

     [このページのトップへ]


9067. Re^9: 判別分析の各群に属する確率について 青木繁伸  2006/01/16 (月) 14:27
重要な順に言えば
 正判別率
 マハラノビスの平方距離,群に属する確率
 各群・各変数の平均値・標準偏差,各群の分散・共分散行列
でしょうかね。一番細かいところまでというなら,マハラノビスの平方距離を追試計算できる内容ということになるでしょう。

     [このページのトップへ]


9188. Re^10: 判別分析の各群に属する確率について さくら  2006/01/24 (火) 13:20
はじめまして。大学院で心理学を専攻しています。
自分が過去に実践したことのない統計手法を使うときにはいつもこちらで復習させていただいてから,と思っています。

マハラノビスの距離に基づく判別分析を利用したいのですが
マハラノビスの「平方距離」と,マハラノビスの「汎距離」の違いはどこにあるのでしょうか。

サンプルデータとして,下記ページの1群に属する10ケースについて
http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/mahalanobis.html
「平方距離」はここに記載されている内容を元に,
「汎距離」は下記ページのExcelファイル内のマクロを利用して
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/mahalanobis.html
それぞれ計算してみたのですが,距離の大きさが一致しません。
(ケース10については,平方距離が3.53,汎距離が3.92となりました。)

この違いが,計算のどの過程に由来するものなのか教えていただければ幸いです。

平方距離のページでは「重心までのマハラノビスの平方距離」という表現が使われているのに対し
汎距離のページ(Excelワークシート内)では「平均値からのマハラノビスの汎距離」という表現が使われているのですが
”平均値と各データの差分”と”分散共分散行列の逆行列”を利用している点で,両方とも同じ過程を経ているように思うのですが…。

     [このページのトップへ]


9190. Re^11: 判別分析の各群に属する確率について 青木繁伸  2006/01/24 (火) 13:49
汎距離と平方距離は同義語として使っていますね。
距離を計算するときの分散共分散行列の定義が違うのかな?

http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/mahalanobis.html
の結果のところに,注釈として

分散・共分散行列(分散・共分散の計算で分母はデータの個数とする)

と書いてありますね。

http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/mahalanobis.html
では,実際の計算を見ると,データの個数マイナス1で割っているのがわかります。

     [このページのトップへ]


9193. Re^12: 判別分析の各群に属する確率について さくら  2006/01/24 (火) 14:25
さっそくご回答いただき,どうもありがとうございます。
汎距離と平方距離は同義語として使われていること,
そして分散共分散行列の計算式では分母が異なっていたこと,
理解できました。ありがとうございました。

もう一つお教えいただきたいことがあります。
いま扱っているデータは3群のデータで,各群約500ケースで10変数をもっています。
この1500ケース以外の,新規ケースがどの群に属するかを予測する際に
「1つの新規ケースについて3群の“平均値からのマハラノビス汎距離”をそれぞれ求め,もっとも距離が小さくなる群に属する」と考えていたのですが
汎距離と平方距離が同義語であるとのことですので,“平方距離”のページを参考にし,各群に属する確率が求められることがわかりました。
しかしこの時,どの群に属する確率も低い(1%未満)ケースがあった場合「上記3群のどれにも属さない」と言ってしまってもよいものでしょうか。

本 来ならば,そのようなケースが出ないようにするためには判別関数を算出する時点で十分大きな数のデータを投入するのが妥当かと思いますが,測定対象の個体 差が大きいために集団から大きく外れたケースが出てきた場合のことです。あるいは,こういう種類のデータは,そもそも判別分析にかけること自体向いていな いのでしょうか。

     [このページのトップへ]


9071. Re^10: 判別分析の各群に属する確率について あきた  2006/01/16 (月) 15:03
青木先生
度々のご返答ありがとうございます。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 036 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る