No.01169 2つのグループの線形判別分析における境界について  【林】 2006/09/24(Sun) 17:35

研究で線形判別分析を使っている学生です。
判別分析のグループの境界をどう設定すればよいかについて疑問がありますので教えてください。

2つのグループ,5つの変数を持つデータを線形判別分析によって分類したいのです。
線形判別分析によって,判別関数は求められたのですが,
2つのグループの境界となる判別得点をどのように決めたらいいのか分かりません。
授業で習ったのは,各グループの判別得点の平均値をとり,2平均値の中間値を境界とする,というものでした。
ところがホームページなどで調べますと,マハラノビス汎距離を使っているものも出てきます。
どのように境界値をとるのが妥当な方法でしょうか?
よろしくお願いいたします。

No.01170 Re: 2つのグループの線形判別分析における境界について  【青木繁伸】 2006/09/24(Sun) 18:03

マハラノビス距離に基づく結果と判別得点の平均値の中点を境界とするというのは,食い違いがありますか?
食い違いがない場合,マハラノビス距離に基づく方法の優位点も書かれているのでは?

No.01173 Re: 2つのグループの線形判別分析における境界について  【林】 2006/09/25(Mon) 03:43

青木先生

お返事ありがとうございます。

> 食い違いがない場合,マハラノビス距離に基づく方法の優位点も書かれているのでは?
私の調べた限り,マハラノビス距離と判別得点の平均値の中点を境界とする2つの方法について書かれたものは見つかりませんでした。

私の理解では,マハラノビス距離はグループの分散の違いを考慮しており,
マハラノビス距離が等しくなる点を境界とすれば,
判別得点の平均値の中点を境界とするよりも正確である,
ということであっていますか?
もし私の理解が間違っていましたら,参考になる論文やウェブサイトを教えていただけると有難いです。

これに関連した質問ですが,
先生の提供されているプログラムで,下記のページの出力結果例で,
「判別関数$d.functionのConstant」はどの方法を使って計算されているのでしょうか?
Rを使ったことがないので,コードを解読できません。
http://aoki2.si.gunma-u.ac.jp/R/disc.html
どうぞよろしくお願いします。

No.01174 Re: 2つのグループの線形判別分析における境界について  【青木繁伸】 2006/09/25(Mon) 07:16

> マハラノビス距離はグループの分散の違いを考慮しており

これは,二次の判別分析の場合ですね。

マハラノビスの距離による判別は線形判別分析でも二次の判別分析でも計算されます

> 「判別関数$d.functionのConstant」はどの方法を使って計算

それは,線形判別分析ですね

3群以上の場合は,マハラノビスの距離による判別の方が煩わしくないので

ただ,その場合でも,各群の分散・共分散行列は等しいとするのが線形判別分析です

No.01175 Re: 2つのグループの線形判別分析における境界について  【林】 2006/09/25(Mon) 08:34

何度もお返事下さりありがとうございます。

私の知識不足のため,少し混乱しています。
線形判別分析は各群の分散・共分散行列は等しいとしているので,
マハラノビスの距離が等しい点と,判別得点の平均値の中点を境界は
等しいということなのでしょうか?

このホームページの一番最後には,
『判別の分点には判別得点の平均値の中点を用いる』と書かれていますね。
http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node43.html

少し,自分でも勉強してみます。
ありがとうございました。

No.01176 Re: 2つのグループの線形判別分析における境界について  【青木繁伸】 2006/09/25(Mon) 08:49

距離だけで分類すると必ずどちらかに分類されることになるけど,マハラノビスの距離とそれに基づく各群への所属確率を見ると,どちらの群に所属する確率も低い場合があるということです。

Rのページからもリンクを貼っている
http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/index.html
は見ていないのでしょうか?

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る