★ 判別分析の必要サンプル数 ★

9565. 判別分析の必要サンプル数 しまうま 2006/03/03 (金) 15:52
└9568. Re: 判別分析の必要サンプル数 青木繁伸 2006/03/03 (金) 17:29
 └9569. Re^2: 判別分析の必要サンプル数 しまうま 2006/03/03 (金) 17:52


9565. 判別分析の必要サンプル数 しまうま  2006/03/03 (金) 15:52
現在,ある製品の開発を行っております。
その製品の各部位の寸法を色々変えて,試験を行っており,結果を良,△,悪の3グループに分けて評価しています。
この製品の各部位の寸法を説明変数,評価の3段階を従属変数として判別分析をかけたのですが,試験数がまだまだ少ないのか有意義な結果が得られません。
現在は,試験数:60 (良:43,△:9,悪:8)です。
一般的に,どのくらいの試験数があればいいとかあるのでしょうか?

また,この変数を用いてマハラノビス距離を求めようと
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/mahalanobis.html
にて計算してみましたが,逆行列が求められないと言われました。
データが何か悪いのでしょうか?

以下,データの一部を記載致します。
サンプル 部位A 部位B 部位C 部位D 部位E 部位F 部位G
1 0.393 0.414 0.021 0.135 0.028 0.032 91
2 0.392 0.415 0.023 0.131 0.029 0.034 101
3 0.388 0.417 0.029 0.129 0.029 0.033 105
4 0.392 0.418 0.026 0.128 0.032 0.030 98
5 0.394 0.415 0.021 0.135 0.034 0.036 97
6 0.393 0.416 0.023 0.131 0.030 0.030 100
7 0.393 0.419 0.026 0.131 0.031 0.031 103
8 0.393 0.412 0.019 0.133 0.030 0.030 92
9 0.391 0.414 0.023 0.134 0.032 0.030 102
10 0.392 0.413 0.021 0.129 0.030 0.031 100
11 0.393 0.418 0.025 0.129 0.033 0.030 99
12 0.394 0.415 0.021 0.134 0.036 0.031 102
13 0.391 0.414 0.023 0.129 0.034 0.032 100
・・・

何卒,ご教授のほど宜しくお願い申し上げます。

     [このページのトップへ]


9568. Re: 判別分析の必要サンプル数 青木繁伸  2006/03/03 (金) 17:29
半角カタカナは使わないでくださいと,上の方に書いてあります。

> 一般的に,どのくらいの試験数があればいいとかあるのでしょうか?

安定的な判別ができる判別関数が得られれば,そのときに十分な試験数であったと言えるでしょう。
ですから,どのくらいなら安定した信頼できる判別といえるかの基準も必要になることがわかりますね。

> また,この変数を用いてマハラノビス距離を求めようと
> http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/mahalanobis.html
> にて計算してみましたが,逆行列が求められないと言われました。
> データが何か悪いのでしょうか?

データの一部分が示されても,「ここが問題ですよ」と指摘できませんが,要するに逆行列を求めようとした行列が一次従属なために逆行列が求まりませんということです。ーーーって,説明になってないじゃんか。
もう少しわかりやすく言えば,同じような値の動きをする変数があったりするとそんなことが起こるわけです。
例えば,以下のような3変数データ
x,y,z
1,2,3
2,4,6
3,5,8
2,1,3
4,3,7
から相関係数を求めると
> r <- cor(x)
> r
[,1] [,2] [,3]
[1,] 1.0000000 0.4160251 0.7809878
[2,] 0.4160251 1.0000000 0.8928437
[3,] 0.7809878 0.8928437 1.0000000
ということになり,その逆行列を求めようとすると
> solve(r)
以下にエラーsolve.default(r) : システムは数値的に特異です:条件数の逆数 = 1.41311e-17
ということになるということと同じです。

     [このページのトップへ]


9569. Re^2: 判別分析の必要サンプル数 しまうま  2006/03/03 (金) 17:52
> 半角カタカナは使わないでくださいと,上の方に書いてあります。
大変申し訳ございませんでした。


> 安定的な判別ができる判別関数が得られれば,そのときに十分な試験数であったと言えるでしょう。
> ですから,どのくらいなら安定した信頼できる判別といえるかの基準も必要になることがわかりますね。
>
試験数を増やして,経過観察してみます。

> データの一部分が示されても,「ここが問題ですよ」と指摘できませんが,要するに逆行列を求めようとした行列が一次従属なために逆行列が求まりませんということです。ーーーって,説明になってないじゃんか。
> もう少しわかりやすく言えば,同じような値の動きをする変数があったりするとそんなことが起こるわけです。

なるほど!
ある程度相関の高い(今回の場合相関係数0.8以上)変数は,どちらかに絞ったりはしたのですが,それ以下は絞り込めずに全て使用していました。思い切って絞り込もうと思います(もちろん実際の部位の関係などを加味して)

大変,参考になりました。ありがとうございます。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 037 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る