No.03591 regression on proportion  【久方】 2007/06/07(Thu) 02:24

年齢と「ある病気の割合」の関係を調べています.目的変数が Yes/No なので logistic regression を考えましたが,年齢が1あがる時のオッズの変化が一定でないので,logistic regression は向いていない,という結論に達しました.(フィットが悪いです)

そこで,年齢ごとに「ある病気の割合」を計算 (病気の人の数 / 全体の人数)して,それを目的変数とした回帰分析をしようと思います.問題は,サンプルサイズ(全体の人数)が年齢によって違うことです.その年齢ごとの サンプルサイズ(あるいはルート)を重みにして,重み付き回帰分析を行おうと思いますが,何か問題はありますか?

宜しくお願いします.

No.03592 Re: regression on proportion  【青木繁伸】 2007/06/07(Thu) 06:49

同じような結果になるんじゃないかな?
年齢区分して,区分ごとの発病率のロジットをとって,年齢で直線回帰する(ただし,人数で重み付け)ということですよね。
それってロジスティック回帰の精度を落とした版になるのではないですか?(人数で重み付けと言うところは精度を上げることになっているのだろうけど)

No.03601 Re: regression on proportion  【久方】 2007/06/07(Thu) 23:46

結局 age^2 の項をいれた logistic regression で落ち着きました.年齢ごとの発病率にしてしまうと,サンプルサイズを数百万から51(40歳から90歳なので)に減らしてるよ,と言われました.確かにそうですね.

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る