No.11533 多重ロジスティックと重回帰の使い分け  【とうけい】 2009/12/15(Tue) 15:04

統計解析をしていて,多重ロジスティックと重回帰どちらを使うべきか悩んでします。
ある尺度を作成して,(6段階評価)その尺度の評価を従属変数とし,それに関連すると想定する対象者背景などを説明変数として多変量解析をしています。
あ る先輩は尺度の評価を真ん中で分けて2値にしてロジスティックをするほうが結果を解釈するときに表も見やすい(オッズ比が示される)し結果の読み手にわか りやすいから検出力が多少落ちるとしても,多重ロジスティックで解析したほうがいいとアドバイスをもらいました。(2値にするとは,たとえば負担感を 1−6で評価して,数字の大きいほうが負担が強いとしたとき,1,2,3→負担感なし,4,5,6,→負担感あり,として負担感ありの確率を求める)
し かし,ほかのある先輩は尺度として点数化できるものだから,従属変数をそのまま連続変数として重回帰をするのが自然であるし,ロジスティックをやると統計 手法についてわかっていないという印象を結果の読み手に与えてしまうから重回帰でやるべきではないか,とのアドバイスがありました。

ちなみに多重ロジスティックでやっても重回帰でやっても結果はほとんど変わらないので,統計手法を選ぶ方法論的な部分の問題なのかな,と思ったりするのですが,連続変数である従属変数を2値にして名義変数扱いにして多重ロジスティックをするのはよくないのですか?

ご教授いただけましたら幸いです。
よろしくお願い致します。

No.11537 Re: 多重ロジスティックと重回帰の使い分け  【青木繁伸】 2009/12/16(Wed) 08:41

その従属変数とされる6段階の値を持つ尺度がどのような分布を持つのかがわかりませんので,確定的なことはいえないのですけど。

> 尺度として点数化できるものだから,従属変数をそのまま連続変数として重回帰をするのが自然であるし,

その従属変数は連続変数ではないし,間隔尺度と見なせる保証もないし(少なくとも,質問の中にはそのれに関する言及はない),正規分布に従う(誤差も正規分布に従う)ということはいえないでしょう。とても,「自然である」とはいえないと思います。

> ロジスティックをやると統計手法についてわかっていないという印象を結果の読み手に与えてしまうから重回帰でやるべき

これには反論があるので,重回帰分析をやったことのほうが不適切(統計手法がわかっていない)ということになる可能性もあるでしょう。

従属変数が,順序を持つ多項の場合には「順序ロジスティック回帰」でしたかね?

No.11538 Re: 多重ロジスティックと重回帰の使い分け  【とうけい】 2009/12/16(Wed) 12:07

ご教授ありがとうございます。

確かに従属変数は連続変数とは言えないし(そもそも連続変数ではないですね)間隔尺度とも言い難いですね。
ちなみに,従属変数の6段階尺度は「非常にそう思う」〜「全くそう思わない」の6件法です。
全部で30項目ですが,シャピロウィルク検定から各項目は正規分布から外れてはいないことはわかっています。
誤差も正規分布に従うかは私にはわかりませんでした…。

順序ロジスティック回帰は初めて聞くのでわかりませんが,重回帰でないとおかしいという意見は妥当でない点はわかりました。
多重ロジスティックで結果を示そうかという気持ちです。

先輩からの意見で重回帰でないと間違えかなのかと不安を抱いたので,ご教授いただいたことで不安が解消されました。ありがとうございます。

No.11548 Re: 多重ロジスティックと重回帰の使い分け  【知ったかぶり】 2009/12/17(Thu) 22:38

>多重ロジスティックで結果を示そうかという気持ちです。

それはやめた方が良いのでは.2 値化するということは,最初から2段階評価にするのと同じこと,つまり情報を捨てているということです.青木先生ご指摘のように,この場合の従属変数の分 布に忠実なのは,順序ロジスティック回帰.ただし,分野によっては重回帰でもOKということもあるでしょう.少なくとも2値化してロジスティック回帰をす るよりは重回帰の方がマシだと思います.

No.11571 Re: 多重ロジスティックと重回帰の使い分け  【とうけい】 2009/12/21(Mon) 19:44

知ったかぶりさん,ご指摘ありがとうございます。
私は解析をSASで行っておりますが,どなたかSASでの順序ロジスティックの解析法をご存じの方がいらっしゃればご教授いただけますと幸いです。
proc logisticのプロジージャーにオプションで何かコマンドを追加するのかなあ,,,とは思うのですが…
ちなみに初心者ですのでマクロは使ったことがないので,基本的な方法をご教授いただけましたら幸いです。
よろしくお願い致します。

No.11572 Re: 多重ロジスティックと重回帰の使い分け  【青木繁伸】 2009/12/21(Mon) 21:33

SAS "ordinal logistic regression" でググってみると良いでしょう(英語で書かれたサイトを選択すると良いでしょう)
http://www.ats.ucla.edu/stat/sas/output/sas_ologit_output.htm
など。実例が解釈のしかたと共に説明されていますよ。
http://www.nesug.org/Proceedings/nesug05/an/an2.pdf
は,かなり詳しく記載されていると思いますけど。
http://www.technion.ac.il/docs/sas/stat/chap39/sect45.htm
とか,
http://www.uky.edu/ComputingCenter/SSTARS/www/documentation/logisticregression_1.htm
とか,
いっぱい見つかると思いますけどね。

No.11573 Re: 多重ロジスティックと重回帰の使い分け  【とうけい】 2009/12/22(Tue) 10:46

青木先生,情報ありがとうございます。
ご教授いただいた情報をもとに試したところ,SASで解析できそうです。とても助かりました。
順序ロジスティックは聞いたことがいままでなく,先輩方も使ったことがない統計手法だったので,今回とても勉強になりました。

別の質問で大変恐縮ですが,1つ質問をさせていただきたく存じます。
ロジスティックモデルの適合度をチェックしたいと思い,その方法を調べたところ,Hosmer-Lemeshow検定でおこなえることがわかりました。
SASではロジスティックのプロシージャーにオプションで「/LACKFIT」を使えばいいとあったので,行ってみましたがモデルの適合度の結果をみるのに,「予測確率と観測データの応答との関連性」の「一致の割合」をみればよろしいのでしょうか。

初歩的な質問で申し訳ありません。
ご回答いただけましたら幸いです。

よろしくお願い致します。

No.11574 Re: 多重ロジスティックと重回帰の使い分け  【青木繁伸】 2009/12/22(Tue) 13:02

前もってお断りしておきますが,私は SAS は使いません(使ったことがありません)。
ですので,私が書くのは,インターネットから得られる情報に基づいています。正しいかも知れませんが,正しくないかも知れません。

日本語訳がどうなっているのか判りませんが,http://www.ats.ucla.edu/stat/sas/seminars/sas_logistic/logistic1.htm ("SAS LACKFIT" でググって,一番最初に出てきたものです)の "LACKFIT and RSQUARE Option" というところに例があって(説明もありますが),以下のような部分が示されています。
Hosmer and Lemeshow Goodness-of-Fit Test

Chi-Square DF Pr > ChiSq

5.2766 8 0.7276

No.11576 Re: 多重ロジスティックと重回帰の使い分け  【とうけい】 2009/12/22(Tue) 19:56

青木先生,お返事ありがとうございます。

おかげさまでSASの適合度検定の方法がわかりました。
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る