No.13069 ロジスティック回帰分析  【さやま】 2010/07/15(Thu) 14:03

ロジスティック回帰分析において,データ数の偏りが与える影響について教えてください。
例えば,身長の高さによっ て,戦いに勝つか負けるかに関係が見られるかどうかを調べたいとします。勝つを1,負けるを0としてロジスティック回帰分析をしたとします。サンプリング の際に,身長の高い人の割合が高く,とれたデータに偏りができてしまった場合,データ数の偏りによって,傾向が出やすくなるといったことは起こるのでしょ うか。
よろしくお願いいたします。

No.13070 Re: ロジスティック回帰分析  【青木繁伸】 2010/07/15(Thu) 15:13

当然起こります。

No.13071 Re: ロジスティック回帰分析  【さやま】 2010/07/15(Thu) 16:00

ありがとうございます。偏りを補正する方法を考えたいと思います。

No.13201 Re: ロジスティック回帰分析  【おおまち】 2010/08/03(Tue) 04:45

そのようなデータの場合,バイアスを最小限にするために,どのように補正すればよいのでしょうか?私もサンプリングしたデータと母集団で比べた時,ある年代が極端に少なく,それでロジスティック回帰分析を行いました。補正の仕方についてどうすればよいのか悩んでいます。
御教示いただけますと助かります。よろしくお願い致します。

No.13211 Re: ロジスティック回帰分析  【青木繁伸】 2010/08/04(Wed) 17:35

補正するのに必要なデータがないと補正はできないでしょう。
そして,補正するのに必要なデータというのは とることができない(難しい)でしょう。つまり,極端に少ない年代のデータを追加するか,その年代も他の年代と比べてまったく違いがないという証拠を得る か,少し違いがあるならどの程度の違いなのかというデータを取らないといけない(結局追加データをとらないといけない。それはもう今となっては手遅れ。前 にデータを取ったときと今では,状況が違っているかもしれない。)。
したがって,三段論法的にいえば,結局のところ補正はできないということになると思います。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る