No.21593 説明変数を対数変換  【はるうらら】 2015/03/26(Thu) 13:29

尿酸と心血管病発症との関係をlogistic modelでみています。
高感度CRPを調整因子にいれているのですが,高感度CRPの分布は0近くに山があって右に裾をひいており,logをとると正規分布します。
logをとって調整因子にいれるよういわれたのですが,わたしの理解では,説明変数の分布は特になんでもよかったような,,,,
調整因子をlogをとって正規分布にするメリットを教えていただければ幸いです

No.21594 Re: 説明変数を対数変換  【scdent】 2015/03/27(Fri) 17:00

高感度CRP値が上昇するにつれて心血管病発症率が高くなると思われますが,Logistic modelの目的変数と説明変数の関係において,説明変数として高感度CRP値を用いた方とlog(高感度CRP値)を用いた方のどちらが目的変数を推定しやすいか(=直線関係で示せるか)ですから,logをとらないのと,とるのとでは当然違ってきますよね。
説明変数の分布がどうでも良いというのは,説明変数がカテゴリカルデータのときのことでしょうね。

No.21595 Re: 説明変数を対数変換  【はるうらら】 2015/03/31(Tue) 08:03

言葉足らずでした。どういった解析をするかはyの分布で決まる→調整因子の分布は右に裾をひいていてもいいと理解しています。
たしかにもしlog(高感度CRP値)をモデルに入れた方が当てはまりがいいなら,logをとって調整因子に入れた方が,検討因子と目的変数の真の関係をみれるというわけですかね。

高感度CRP値を用いたモデルとlog(高感度CRP値)を用いたモデルのふたつを比べないとどちらがいいかはわからないということでしょうか?

あるいは一般的に説明変数も正規分布させたほうがいいことがおおいのでしょうか?

No.21596 Re: 説明変数を対数変換  【scdent】 2015/03/31(Tue) 15:02

高感度CRP値を用いたモデルとlog(高感度CRP値)を用いたモデルのふたつを比べないとどちらがいいかはわからないということでしょうか?
→はい,そのように考えています。あるいは,尿酸を3層くらいに分けて,層別に高感度CRP値の影響とlog(高感度CRP値)の影響をlogistic modelで比較するのがわかりやすいと思います。

あるいは一般的に説明変数も正規分布させたほうがいいことがおおいのでしょうか?
→正規分布させるために対数をとるのではなく,目的変数と線形関係を持たせるためだと理解しています。

No.21597 Re: 説明変数を対数変換  【はるうらら】 2015/04/14(Tue) 16:13

ありがとうございます!

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る