★ 尤度比検定に関して ★

4155. 尤度比検定に関して 山昌 2004/09/04 (土) 19:59
└4157. Re: 尤度比検定に関して 青木繁伸 2004/09/04 (土) 21:48
 └4159. Re^3: 尤度比検定に関して 青木繁伸 2004/09/04 (土) 23:17
  └4160. Re^4: 尤度比検定に関して 青木繁伸 2004/09/04 (土) 23:24
   ├4162. Re^5: 尤度比検定に関して 青木繁伸 2004/09/04 (土) 23:40
   │└4163. Re^6: 尤度比検定に関して 山昌 2004/09/05 (日) 00:23
   └4161. Re^5: 尤度比検定に関して 山昌 2004/09/04 (土) 23:38


4155. 尤度比検定に関して 山昌  2004/09/04 (土) 19:59
現在,あるデータの独立性を分析したく,尤度比検定を勉強しております。私が行いたいのは,複数の要因によって成長した4つの業種において,業種によってその成長に必要な要因が異なっているかどうかという分析です。

下 表は,A-Dは4種類の業種,a-xは各業種の成長に影響を及ぼした要因,数値はその要因が該当した事例数を示しております。(例えば,下表において業種 Aがaという要因によって成長した事例が2事例あることを示しております。)見ての通り,セルの中に『0』が複数含まれており,期待度数が5以下になるた め尤度比検定を採用しました。また,フィッシャーの正確確率検定も検討したのですが,下表のような大きなデータは,Rを用いてもエラーとなってしまい分析 不可能でした。
 <データ>
 A B C D 
a 2  3  3  0 
b 1  0  3  2 
c 3  2  6  1
d 0 2  2  1 
e 1  1  4  0 
・    ・
・  ・
・  ・
z2  0  3  0 
こ のようなデータを用いて尤度比検定を行い,有意差が出た場合,aからzまでの要因は,AからDの各業種によってその表れ方に違いがあるといえる,つまり, 業種によって成長に必要な要因が異なっている。という結論に導くやり方は,間違っていますでしょうか。分析方法,考え方を含めまして,ご指導・ご意見をい ただければ幸いです。
お忙しいところ,恐縮ですが何卒宜しくお願い致します。

     [このページのトップへ]


4157. Re: 尤度比検定に関して 青木繁伸  2004/09/04 (土) 21:48
この集計表の合計は,対象企業の数と同じでしょうか。
つまり,ある企業は必ず,どれか一箇所のセルに落ちるのでしょうか。
関係ないですが,要因(a 〜 z) はちょうど26個あるのですか??

データ行列が
    業種  a  b … z
あ社   □ ○ ○ … ○
い社   □ ○ ○ … ○
 :
ん社   □ ○ ○ … ○
□は A, B, C, D により 1,2,3,4 とか(あるいは3つのダミー変数)
○は 0 か 1(該当すれば1)

のようになっているとすれば,当てはまる要因は複数個存在して良いということでしょう。
(逆に複数個あるなら,あなたが示したような分割表は作れない)。

そのようなデータ行列になるデータを分析するには,判別分析とか数量化II類とか,クラスター分析とかその他いろいろあるのではないでしょうか。

     [このページのトップへ]


4159. Re^3: 尤度比検定に関して 青木繁伸  2004/09/04 (土) 23:17
ですからね,
>  <各社新規事業における重要な要因の抽出>
>  素材    部品    組立    サービス
>  あいう・・ かき・・  さし・・  たちつ・・
>  社社社   社社    社社    社社社
> a ○     ○            ○
> b  ○○   ○○     ○    ○ ○
> c  ○          ○○      ○
> d ○      ○    ○     ○○○
> e ○ ○   ○     ○     ○
> ・
> ・
> ・
このデータ行列の行と列を入れ替えた(転置した)ものが,私が書いたデータ行列でしょう?

そういうわけ,ですから,
> (※上記の例をそのまままとめたもの)
>  素材 部品 組立 サービス
> a 1  1  0  1
> b 2  2  1  2
> c 1  0  2  1
> d 1  1  1  3
> e 2  1  1  1
> ・
> ・

という集計表の合計は(要因に重複があるのだから)対象企業数ではない。
そのような(重複回答のある)分割表を尤度比検定したりカイ二乗分布を用いた独立性の検定はできないのです。

あなたのデータが,私が示したようなデータ構造をしているのですから,判別分析や数量化II類も適用できるでしょう(むしろ,そのような分析手法で分析すべし)ということなんです。

データ行列(の形式というか表現)というのは,コンピュータを使ってデータを集計したりするときの基本ですから,ちゃんと整理した方がいいです。
世の中の多くの統計ソフトは私が示したようなデータ行列を対象にします。
すなわち,各行は測定・対象となるもの。今の場合だと対象企業。
各行は様々な特性を表す複数の数値。今の場合だと,対象企業の業種,各要因。

私が示したようなデータ構造にして,しかるべきソフトに通すと,あなたが今使っているような重複回答を許す集計表も得ることができる。しかし,その集計表について,独立性の検定は行えない。

     [このページのトップへ]


4160. Re^4: 尤度比検定に関して 青木繁伸  2004/09/04 (土) 23:24
まとめ
重複のない二重クロス集計表の総合計欄の数値は,データ行列の行数(つまり対象数)になっていないといけない。
そのようなものでないと,独立性の検定はできない。
もっと適切な分析手法がある。

なお,対象の特性を表す変数の個数は,対象数よりも多くては,多変量解析は行えない。
今の場合だと,対象企業数が30というのは,「少なすぎる」。
要因が47種で,それに業種を表す変数が加わって48個の変数と言うことだが,たとえ対象数(対象企業数)を増やして,分析可能なぎりぎりの49企業になっても,そのデータから得られる分析結果は不安定なものであろう。

     [このページのトップへ]


4162. Re^5: 尤度比検定に関して 青木繁伸  2004/09/04 (土) 23:40
蛇足

それぞれの要因ごとに
       業種A  業種B  業種C  業種D   合計
該当する   ○○○ ○○○ ○○○ ○○○ ○○○
該当しない  ○○○ ○○○ ○○○ ○○○ ○○○
合計     ○○○ ○○○ ○○○ ○○○ △△△
のような二重集計表を作ると△△△の位置に来る総合計は対象企業数(今の場合だと30)になりますよね。
このような場合には独立性の検定ができます。それは,「この要因は業種によって違いがあるか」という仮説の検定をすることになりますね。
これを47の要因について繰り返し,一つずつ結果を吟味していけばよいように思いますが,どのように総合するかが難しいでしょう。

それで,判別分析や数量化II類をやろうかなあ,ということになる訳なんですよ。

     [このページのトップへ]


4163. Re^6: 尤度比検定に関して 山昌  2004/09/05 (日) 00:23

> それぞれの要因ごとに
>        業種A 業種B 業種C 業種D 合計
> 該当する   ○○○ ○○○ ○○○ ○○○ ○○○
> 該当しない  ○○○ ○○○ ○○○ ○○○ ○○○
> 合計     ○○○ ○○○ ○○○ ○○○ △△△
>
> のような二重集計表を作ると△△△の位置に来る総合計は対象企業数(今の場合だと30)になりますよね。
> このような場合には独立性の検定ができます。それは,「この要因は業種によって違いがあるか」という仮説の検定をすることになりますね。
> これを47の要因について繰り返し,一つずつ結果を吟味していけばよいように思いますが,どのように総合するかが難しいでしょう。
>
> それで,判別分析や数量化II類をやろうかなあ,ということになる訳なんですよ。

度重なるご指導誠に有り難うございます。
先生のご指導を参考にこれからどうするかもう一度考えたいと思います。有り難うございました。

     [このページのトップへ]


4161. Re^5: 尤度比検定に関して 山昌  2004/09/04 (土) 23:38
> 重複のない二重クロス集計表の総合計欄の数値は,データ行列の行数(つまり対象数)になっていないといけない。
> そのようなものでないと,独立性の検定はできない。
> もっと適切な分析手法がある。
>
> なお,対象の特性を表す変数の個数は,対象数よりも多くては,多変量解析は行えない。
> 今の場合だと,対象企業数が30というのは,「少なすぎる」。
> 要因が47種で,それに業種を表す変数が加わって48個の変数と言うことだが,たとえ対象数(対象企業数)を増やして,分析可能なぎりぎりの49企業になっても,そのデータから得られる分析結果は不安定なものであろう。

お忙しいところ,ご指導いただき有り難うございました。
大変勉強になりました。
別の分析方法を考えてみたいと思います。
本当に有り難うございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 030 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る