No.11891 多重の検定と単独の検定  【金井】 2010/01/29(Fri) 11:10

よろしくお願いいたします。
ひとつの事象が起こる,起こらないを説明する要因5つ測定しています。
この場合,GLMで二項分布でモデル選択する方法があると思います。
ひとつ,ひとつについて単独でU検定(起こる,起こらないでの群間比較)をして,その要素が効いているか,いないかを出すこともできると思います。
おそらく,こういう場合はモデル選択が好ましいと思われるのですが,単独で行う際の悪い点について教えてください。
また,サンプル数などの欠損値の問題で,モデル選択にかけられない場合,下の方法で行うしかないのでしょうか。

No.11894 Re: 多重の検定と単独の検定  【青木繁伸】 2010/01/29(Fri) 12:10

この質問もよく出てきますが,要するに,単変量解析の結果をいくら総合しても多変量解析にはならないということで す。すべての変数が同時に作用しているなら(実際そうですが),多変量解析しなくてはいけません。では,単変量解析は不要かというとそうではありません。 単変量解析の結果は,多変量解析の結果をぎんみする上で重要な役割を果たすでしょう。たとえば,単純に多変量解析結果を補強することもあるでしょうが,逆 にもし相反する結果になったときに,なぜそうなったかを深く考察するきっかけになるでしょうということ。

> サンプル数などの欠損値の問題で,モデル選択にかけられない場合,下の方法で行うしかないのでしょうか。

欠損値がどれくらいあって,分析に使えるデータ数がどれくらいになるかによるでしょう。欠損値のためにモデル選択できないという状態なら,単変量解析結果の信頼性も疑われるのではないでしょうか?

#「モデル選択にかけられない」,「検定をかける」とか「調査をかける」とか,「名詞+かける」をむやみに使う人が多いなあ

No.11913 Re: 多重の検定と単独の検定  【金井】 2010/02/01(Mon) 19:18

青木先生,ありがとうございます。
言葉の遣い方のご指摘もありがとうございます。

論文などで,単変量解析と多変量解析(モデル選択)の結果を両方を示してもいいものでしょうか。2重で解析してしまっているような印象を受けてしまい,正しいのかどうか分かりません。

また,2年分データをとっているのですが,1年分の1つの説明変数においてすべて欠損値になってます。
単変量解析では2年分で解析して,多変量解析では1年分で解析することは不適切なデータの示し方となりますよね?多変量解析の結果を補足としてでも示したいと考えているのですが,解析の仕方および示し方として正しいのかどうか,今の私には判断できません。

度々申し訳ございません。よろしくお願いいたします。

No.11914 Re: 多重の検定と単独の検定  【青木繁伸】 2010/02/01(Mon) 22:04

> 論文などで,単変量解析と多変量解析(モデル選択)の結果を両方を示してもいいものでしょうか。2重で解析してしまっているような印象を受けてしまい,正しいのかどうか分かりません。

そのような論文例が先行研究(先例)として,数多く刊行されているようですが,非常に不適切な状態だと思います。(まあ,先例に従っておけば,少なくともその論文誌では問題なく通るでしょう)

> 単変量解析では2年分で解析して,多変量解析では1年分で解析することは不適切なデータの示し方となりますよね?

その変数がどういうもので,どのように重要なのか判断ができないのですが,その変数だけを除いて2年分のデータを多変量解析すればよいでしょう?(それが重要な変数なら,なんで,全数欠損値に至ってしまったか十分反省する必要があるでしょう)

No.11921 Re: 多重の検定と単独の検定  【金井】 2010/02/02(Tue) 09:03

ご回答,ありがとうございます。

>そのような論文例が先行研究(先例)として,数多く刊行されているようですが,非常に不適切な状態だと思います。

非 常に不適切であるという理由について教えていただけますでしょうか。1つのデータについて,2つの方法で解析してしまっていることから,おかしいというこ とは分かるのですが,自分の中でちゃんと理解できていません。勉強不足で大変申し訳ないのですが,教えていただけると嬉しいです。

>その変数がどういうもので,どのように重要なのか判断ができないのですが,その変数だけを除いて2年分のデータを多変量解析すればよいでしょう?

今 回の結果では,影響を与える要因とはならないのですが,先行研究では影響を与えているという変数です。なので,このデータも示すべきだと思っており,欠損 値が出てしまったことは反省しています。このような理由で,5変数について示したいため,データ解析の方法としては単変量で解析するしかないのかと考えて おります。(データを示しているのに,多変量解析から外しているのは不適切だと考えられるので。)

No.11923 Re: 多重の検定と単独の検定  【青木繁伸】 2010/02/02(Tue) 10:33

> 非常に不適切であるという理由について教えていただけますでしょうか

No. 11894 に書きました。
同じデータを何通りかの手法で分析するのは別に悪くはないでしょう。
不適切な方法で分析するのがよくないのです。

> データを示しているのに,多変量解析から外しているのは不適切だと考えられるので

欠損値になったと正直に書いて,多変量解析の対象にならないからと書くしかないでしょう。

No.11927 Re: 多重の検定と単独の検定  【金井】 2010/02/02(Tue) 15:31

ご回答,ありがとうございます。度々申し訳ございません。

>不適切な方法で分析するのがよくないのです。

すべての変数が同時に作用しているのに,単変量で解析をすることが不適切ということでよろしいでしょうか。だから,論文でも多変量の解析結果のみを示すべきであって,単変量の結果を示すべきではないというという意味で解釈して正しいでしょうか。

>欠損値になったと正直に書いて,多変量解析の対象にならないからと書くしかないでしょう。

変数を少なくしたとしても,すべての変数が同時に作用しているという条件がある以上,多変量解析で行うべきということですよね。ありがとうございます。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る