★ エクセル統計の分散分析 ★
2129. エクセル統計の分散分析 田中 慶太 2004/01/30 (金) 18:39
├2148. Re: エクセル統計の分散分析 uchan 2004/02/01 (日) 19:07
│├2151. Re^2: エクセル統計の分散分析 青木繁伸 2004/02/01 (日) 20:19
││└2152. Re^3: エクセル統計の分散分析 uchan 2004/02/01 (日) 22:28
││ └2155. Re^4: エクセル統計の分散分析 田中 慶太 2004/02/02 (月) 05:20
││ ├2164. Re^5: エクセル統計の分散分析 uchan 2004/02/02 (月) 09:31
││ │└2196. Re^6: エクセル統計の分散分析 田中 慶太 2004/02/03 (火) 18:29
││ └2163. Re^5: エクセル統計の分散分析 青木繁伸 2004/02/02 (月) 09:24
││ └2197. Re^6: エクセル統計の分散分析 田中 慶太 2004/02/03 (火) 18:37
││ └2199. Re^7: エクセル統計の分散分析 青木繁伸 2004/02/03 (火) 18:59
│└2150. Re^2: エクセル統計の分散分析 青木繁伸 2004/02/01 (日) 19:20
├2141. Re: エクセル統計の分散分析 田中 慶太 2004/01/31 (土) 19:01
├2137. Re: エクセル統計の分散分析 冨田雅一 2004/01/30 (金) 21:54
└2134. Re: エクセル統計の分散分析 青木繁伸 2004/01/30 (金) 21:06
2129. エクセル統計の分散分析 田中 慶太 2004/01/30 (金) 18:39
はじめまして,エクセル統計を用いた分散分析について質問いたします。お分かりになる方がいらっしゃいましたら,是非お願いします。
過去ログの,「量的データをダミー変数に置き換えて数量化II類を行うことは情報の損失などの点からお勧めできない」という
ご意見を見かけ,量的データと質的データの混合した説明変数を用いて,エクセル統計による分散分析を行ってみました。
ところが,実際に出力してみると,エラーメッセージ(「このデータでは逆行列が求められません」→「分析を終了します」)が出てしまいます・・・。
初心者ですので,意味がよくわからなく,データに問題があるのかなぁ,なんて思ってしまいました。
具体的には,説明変数は全部で10個で,量的データは1つしかなく,残りは全て質的データです。
一体何が問題なのか私には分かりません・・・。
エクセル統計で,質的・量的データを用いた分散分析を行ったことがある方や詳しい方,アドバイスをいただければ幸いです。
どうかよろしくお願いします。
|
[このページのトップへ]
2148. Re: エクセル統計の分散分析 uchan 2004/02/01 (日) 19:07
> ところが,実際に出力してみると,エラーメッセージ(「このデータでは逆行列が求められません」→「分析を終了します」)が出てしまいます・・・。
ランク落ちの処理が必要のようなので質的データの各アイテムの第1カテゴリーをはずすとうまくいくかも知れません
(数年前ソフトが手に入らずエクセルだけで数量化II類を計算しましたが,逆行列が求まらず苦労しました)
私が質問したわけではありませんでしたが過去ログ302が参考になります
|
[このページのトップへ]
2151. Re^2: エクセル統計の分散分析 青木繁伸 2004/02/01 (日) 20:19
> ランク落ちの処理が必要のようなので質的データの各アイテムの第1カテゴリーをはずすとうまくいくかも知れません
一応,エクセル統計とか言う商品ですから,これが原因ではないでしょう。
|
[このページのトップへ]
2152. Re^3: エクセル統計の分散分析 uchan 2004/02/01 (日) 22:28
> 一応,エクセル統計とか言う商品ですから,これが原因ではないでしょう。
確かにエクセル統計のサンプル見てみたら数量化II類は対応していますね
量的データが混じった場合,エクセル統計の数量化II類処理では処理できないのではと推察します
質問の文脈から考えますと質問者(田中さん)は量的データと質的データの混在する場面で数量化II類の処理にかけることが出来ず(当初量的データを質的データに置き換えも考えたことがわかります)やむを得ず質的データをダミー変数に自分で分解して判別分析の処理にかけたのでは?
|
[このページのトップへ]
2155. Re^4: エクセル統計の分散分析 田中 慶太 2004/02/02 (月) 05:20
>uchanさん
その通りです。
簡潔に述べていただき光栄です(苦笑)。
なんだか,逆に分かりづらくなってしまってたみたいで・・・。
本当にすいません。
当初は,量的データを勝手にダミーに置き換えて,数量化II類で分析していました。
しかし,「情報の損失」という点を踏まえ,何かよい方法はないものかと探し,判別分析にいきつきました。
そこで,エクセル統計を用いて判別分析を行ったのですが,
今度は「標準偏差がゼロになるため計算できません」
となってしまいました・・・。
ダミー変数をを数量化II類の時に用いたまま(カテゴリを1,2,3,・・・としていた)に問題があったのかと思い,それらを全て1,0のダミーとしてみたのですが結果は同じでした・・・。
そこに問題があったわけでもないようです・・・(断言できませんが)。
お恥ずかしい話ですが,つまりは私がエラーメッセージの意味を理解していないんですね・・・(苦笑)。
何か解決策はないものかと模索しております。
|
[このページのトップへ]
2164. Re^5: エクセル統計の分散分析 uchan 2004/02/02 (月) 09:31
> そこに問題があったわけでもないようです・・・(断言できませんが)。
>
アイテムにa,b,cというカテゴリーがあった場合
アイテム
a
b
a
c
b
a
これをダミー変数に置き換えると
カテゴリa カテゴリb カテゴリc
1 0 0
0 1 0
1 0 0
0 0 1
0 1 0
1 0 0
となります
これを分析にかけるとランク落ちになるので (どれでもいいのですが)一番左の列を除き判別分析にかけます
1列除いても他の2列から計算できるので情報量は落ちません
|
[このページのトップへ]
2196. Re^6: エクセル統計の分散分析 田中 慶太 2004/02/03 (火) 18:29
>uchanさん
はい,私が言葉で言っていたのはそれです(苦笑)。
ちなみに私は1列目は除いてやっています。
|
[このページのトップへ]
2163. Re^5: エクセル統計の分散分析 青木繁伸 2004/02/02 (月) 09:24
> 今度は「標準偏差がゼロになるため計算できません」
分析に使用した変数のうち全ケースにわたって同じ値を持つ変数(ダミー変数)があるということではないですか?
|
[このページのトップへ]
2197. Re^6: エクセル統計の分散分析 田中 慶太 2004/02/03 (火) 18:37
>青木繁伸さん
>分析に使用した変数のうち全ケースにわたって同じ値を持つ変数(ダミー変数)があるということではないですか?
私がバカなため,少し意味が分からないのですが(苦笑),ダミー変数の表記の手法としては,uchanさんが書き込みしてくださったものと同様です。
質的データを同様に残り8個設定し,量的データに関しては各サンプルの持つ値をそのまま打ち込んであります。
全く答えになってないかもしれません・・・。
申し訳ないです。
|
[このページのトップへ]
2199. Re^7: エクセル統計の分散分析 青木繁伸 2004/02/03 (火) 18:59
そうですね。最初はカテゴリーを正数で1,2,3なんてふうにコード化していたのでしょうか。
その中で,どのケースも該当しないカテゴリーがあったりしませんでしたか?そのようなカテゴリーをダミー変数で表すと,全ケースが0という値をとり,必然的に標準偏差が計算できませんが。
大きなデータでなければ,ここへぺったんこと貼っていただくといいかもしれませんが(解決したら削除しますが)。
|
[このページのトップへ]
[このページのトップへ]
2141. Re: エクセル統計の分散分析 田中 慶太 2004/01/31 (土) 19:01
>冨田さん,青木さん
ご丁寧に解説していただきありがとうございます。
それから,まず謝罪をさせてください。
私は最初の投稿の中で何度も分散分析と述べていましたが,判別分析の誤りです・・・(恐らく皆さんお気づきかと思われますが・・・・)。
ただの書き間違えなのですが(初心者すぎますね・・・),混乱を招いてしまったようですので深くお詫びいたします。
本当に申し訳ありませんでした。
その他,説明不足なところが多々あり,分かりづらかったかと思いますが,アドバイスをいただいたように,まずは相関係数を見るとこからはじめてみます(苦笑)。
今回はあいにく,量的データが1つしかなく,残りは質的データであることは先にお伝えしました。
これらを用いて,判別分析を行い,判別得点が0になるときの,その量的データの値(閾値とでも言うのでしょうか?)を知りたいと考えているのですが,これは可能でしょうか?
間違いだらけの質問をした挙句にまた質問を投げかけてしまい,申し訳ありません。
もしよろしければご返答ください。
よろしくおねがいします。
|
[このページのトップへ]
2137. Re: エクセル統計の分散分析 冨田雅一 2004/01/30 (金) 21:54
>エラーメッセージ(「このデータでは逆行列が求められません」→「分析を終了します」)が出てしまいます
逆行列が求められない理由は,行列式の値がゼロだから,あるいはきわめてゼロに近いからだと思います。ワークシート関数MDETERM(配列)で確認してみて下さい。
>データに問題があるのかなぁ,なんて思ってしまいました。具体的には,説明変数は全部で10個で,量的データは1つしかなく,残りは全て質的データです。
行列式がゼロになる,あるいはゼロにきわめて近くなるのは,変数の中に互いに一次従属の関係にあるものが含まれているか,相関関係の高いものが存在しているからだと思います。量的データか質的データかということは問題ではないと思います。
>アドバイスをいただければ幸いです。
変数間の相関関係を簡単に調べるには相関行列を作成すればいいです。
(1)各変数の平均と標準偏差を求め,正規化((観測値−平均)÷標準偏差)する。これを行列Aとする。
(2)正規化したデータを「値のみ,行列を入れ替える」で適当な場所にコピーする。これを行列Bとする。
(3)行列B*行列A(MMULT(行列B,行列A))を計算する。これが相関行列です。
要素が0に近いほど独立していて,1あるいは−1に近い変数の組ほど従属関係にあります。相関関係の高い変数を取捨選択し整理するとうまくいくかもしれないです。
なお,私も詳しくはありません。あなたと同じ事態に遭遇した場合に自分がするであろう対応を述べただけです。むしろ諸賢の高評を請うところです。
|
[このページのトップへ]
2134. Re: エクセル統計の分散分析 青木繁伸 2004/01/30 (金) 21:06
> 過去ログの,「量的データをダミー変数に置き換えて数量化II類を行うことは情報の損失などの点からお勧めできない」というご意見を見かけ,量的データと質的データの混合した説明変数を用いて,エクセル統計による分散分析を行ってみました。
なんで,数量化数量化II類と分散分析が連動するかはさておき(連動するのは本質的には正しいのですが)
> ところが,実際に出力してみると,エラーメッセージ(「このデータでは逆行列が求められません」→「分析を終了します」)が出てしまいます・・・。
>
> 初心者ですので,意味がよくわからなく,データに問題があるのかなぁ,なんて思ってしまいました。
データに問題ありなんでしょうね。
> 具体的には,説明変数は全部で10個で,量的データは1つしかなく,残りは全て質的データです。
>
> 一体何が問題なのか私には分かりません・・・。
これで,どうやって分散分析を行ったのか???
> エクセル統計で,質的・量的データを用いた分散分析を行ったことがある方や詳しい方,アドバイスをいただければ幸いです。
エクセル統計は持っていないし,使ったこともないし。
でも,エラーメッセージが言っている意味は何となく分かる。
説明変数が多い割に,データの個数が少ないなんてことはないですか。
あるいは,説明変数が従属である(つまりある二組の変数を見れば,両者が同じような値を取る。具体的に言えば説明変数間の相関係数が高すぎるものがある)ということです。
|
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る