No.05193 Re: マハラノビス距離による帰属率導出の可否 【青木繁伸】 2007/12/27(Thu) 23:04
dat は,4変数データですよね
なぜ,shapiro.test(dat) としてひとまとめで正規性の検定をするんですか?
ひとまとめにしても良い状況もあるでしょうが,そうなら,その事情を明らかにすべきでしょう。
正規性の検定は,データ数が少ないと帰無仮説は採択されがち。
データ数が少ないにもかかわらず帰無仮説が棄却されるというのは,外れ値などが入っているか,異質なデータが混在している(まさに今回のように,異なる変数がまとめて扱われている)のではないでしょうか。
質問したかったことは「多変量正規分布が成り立たない場合にはマハラノビスの汎距離は有効に機能しない」ということでしょう?
それは,イエスでもありノーでもある。
イエスといったら,イエスでない場合のリスクを背負い込む
ノーといったら,その先何にもできない
No.05194 Re: マハラノビス距離による帰属率導出の可否 【青木繁伸】 2007/12/27(Thu) 23:10
なお,本題とは異なるが,
ks.test(dat, "pnorm", mean=mean(dat), sd=sqrt(var(dat)))
はエラーになる
その,原因は
sqrt(var(dat))
にあり。> var(dat)これじゃ,そもそも変だし,その sd を取るのもおかしいがマイナスが出てくるというので完全にアウト
[,1] [,2] [,3] [,4]
[1,] 5.8909091 2.1090909 1.1636364 0.8636364
[2,] 2.1090909 2.0909091 -0.1636364 1.6363636
[3,] 1.1636364 -0.1636364 2.4545455 -1.8454545
[4,] 0.8636364 1.6363636 -1.8454545 6.4545455
sqrt(var(dat)) を sd(dat) とすればよいのかというのもやってみればすぐ分かるが> sd(dat)
[1] 2.427120 1.445998 1.566699 2.540580
それにしても,ks.test の 第一引数がマトリックスで,第二引数が "pnorm" のときの,補助引数 sd= にベクトルが与えられたときの挙動がよく分からない。今は,プログラムを読む気力もないので,またいつか。
No.05238 Re: マハラノビス距離による帰属率導出の可否 【suzuki】 2008/01/02(Wed) 21:26
> 質問したかったことは「多変量正規分布が成り立たない場合にはマハラノビスの汎距離は有効に機能しない」ということでしょう?
はい。多変量正規分布に従うか否かの検定は不要でしょうか?この検定はRで実行可能でしょうか?
[参考文献]
# SPSS マクロ 正規分布・多変量正規分布の検定 http://www.ec.kagawa-u.ac.jp/~hori/spss/tokidoki3.html#39
# D'Agostino-Pearson検定について http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc037/09532.html
No.05239 Re: マハラノビス距離による帰属率導出の可否 【青木繁伸】 2008/01/02(Wed) 21:31
> 多変量正規分布に従うか否かの検定は不要でしょうか?
5193の後半
> この検定はRで実行可能でしょうか?
D'Agostino-Pearson検定のほかにもいろいろあります
● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る