No.13388 ロジスティック回帰分析について  【エミ】 2010/09/10(Fri) 19:02

青木先生
 いつも,先生のご説明を読みながら,独学で勉強をさせていただいています。
 でも,いざ,自分が解析をすると全く自信がありません。
 今回,あるケース群を,効果の有無でA群とB群に分けました。効果の有無を従属変数,影響しうる因子として調査した項目を独立変数として,ロジスティック回帰分析により,両者の関係を分析しようと考えています。
  独立変数として,調査した項目が,10以上(16)あります。本によれば,独立変数は5〜10項目がよいと書いてあります。したがって,年齢,性別等, A,B群で殆ど差がないと予測される項目は,まず,単項目で,有意差がないという検定を行い,項目を絞ってから,ロジスティック回帰分析を行ったらよいの でしょうか。
 また,ダミー変数についてですが,検査の得点を,カテゴリー値にする場合,例えば,30点満点の検査であれば,1〜9:1,10〜19:2,20〜30:3というように,全く任意で決めてよいのでしょうか。
 どうか,ご指導をお願いいたします。

No.13389 Re: ロジスティック回帰分析について  【青木繁伸】 2010/09/10(Fri) 21:06

> 本によれば,独立変数は5〜10項目がよいと書いてあります

先行研究などを参考にして,重要と思われる変数を複数セット設定して分析を行い,分析結果を相互に比較するのがよいでしょう。

> 年齢,性別等,A,B群で殆ど差がないと予測される項目は,まず,単項目で,有意差がないという検定を行い,項目を絞ってから,ロジスティック回帰分析を行ったらよいのでしょうか。

単相関分析をもとに独立変数を決定するというのは,誤った方法です。参考にするのは構わないでしょうが,採用しない方が良いでしょう。

> ダミー変数についてですが,検査の得点を,カテゴリー値にする場合

連続変数については,よほどの根拠(先例)がないかぎり,カテゴリー化(ダミー変数化)しないで,そのまま使う方がよいでしょう。

No.13390 Re: ロジスティック回帰分析について  【エミ】 2010/09/10(Fri) 23:30

青木先生
 早速,ご返信を頂き,ありがとうございました。
 重要と思われる変数を複数セットということですが,例えば,16変数を,カテゴリー別に,分類(1カテゴリーは5〜6項目)し,カテゴリー別に,ロジスティック回帰分析を行っても,良いのでしょうか。
 ご指導を,宜しくお願いいたします。

No.13391 Re: ロジスティック回帰分析について  【青木繁伸】 2010/09/11(Sat) 11:37

「カテゴリー」って何ですか?

> 16変数を,カテゴリー別に,分類(1カテゴリーは5〜6項目)し,カテゴリー別に,ロジスティック回帰分析を行っても,良いのでしょうか

当然ながら,それぞれのモデル(使用する変数セット)はそれなりに意味のあるものでなければなりません。変数セットの部分集合とは言っても,意味のない部分集合もありますよね?

No.13392 Re: ロジスティック回帰分析について  【エミ】 2010/09/11(Sat) 13:53

青木先生
 ご指導,有難うございます。
 カテゴリーというのは,説明変数を,生物学的要因,心理的要因,環境的要因に分類してはどうかと考えたのですが,それだと,それぞれの関連性がわからなくなりますね。
 やはり,はじめから,説明変数を10に絞って分析する方法が,一番,良いのでしょうか。最大,いくつまでの変数だと,信頼性がありますか。
 たびたびで申し訳ありませんが,どうぞ,よろしくお願いいたします。

No.13393 Re: ロジスティック回帰分析について  【青木繁伸】 2010/09/11(Sat) 17:03

> 最大,いくつまでの変数だと,信頼性がありますか。

重回帰分析の場合にはサンプルサイズは独立変数の10倍必要だとか,ロジスティック回帰の場合には少なくとも全サンプルサイズは100は必要だとか,独立変数の10倍のイベント(サンプルサイズにあらず)が必要だとかあるようですけど。

まあ,サンプルサイズが100で10個の独立変数を使いましたと言われて,はいそうですかとはいえないなあ。

No. 11153 からのスレッドも参照。

No.13399 Re: ロジスティック回帰分析について  【エミ】 2010/09/12(Sun) 18:12

青木先生
 11153のスレッド読んでみました。でも,私のサンプル数は,60余りで,今回は,もうこれでいくしかありません(泣)。統計ソフトを使うと,説明(独立)変数16個でも,P値は出るのは出ますが,どうなんでしょうか。
 私の乏しい知識で,最初から,ロジスティック回帰分析を使おうと考えていましたが,実際,これでよいのかも,迷ってきました。
 もう一度,原点に戻ってみると,ある事象の有無をもたらした,要因(生物学的要因,身体的要因,認知的要因等)について分析し,今後の関わり方や方針決定のヒントにしたいと考えているのですが,統計法は,ロジティック回帰分析で,良いですよね。

No.13400 Re: ロジスティック回帰分析について  【青木繁伸】 2010/09/12(Sun) 21:23

> 私のサンプル数は,60余りで

残念ながら,どうしようもなしということで

> 説明(独立)変数16個でも,P値は出るのは出ますが,どうなんでしょうか

検定の解釈そのものですよ。「独立変数1個当たり10サンプル」というのとは別次元でしょう。

> 統計法は,ロジティック回帰分析で,良いですよね。

よいでしょう。というか,それ以外にあるとでも?

No.13401 Re: ロジスティック回帰分析について  【エミ】 2010/09/12(Sun) 23:43

青木先生
 早速のご指導ありがとうございます。今回は,これで行い,次回からは,サンプル数についても,十分考えた研究計画を立てます。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る