No.08781 確率のロジットと期待値のロジット  【じぇいえす】 2008/12/28(Sun) 11:28

統計をきちんと勉強していませんので,恥ずかしいほど基本的なことかもしれませんが。あるソフトでロジスティック回帰分析をしていて,疑問に思ったことがあります。

目的変数は,80%で0を取り,20%で1を取るとすると,0の確率のロジットは2,1の確率のロジットは-2くらいだと思います。多くの関連ページではこのロジットをyにして一次線形の当てはめをするように書かれているように思います。
と ころがあるソフトでは,偏回帰係数が決定され,シュミレーションが行われると,でてくる値は,ロジット2(期待値0.8,実測値(目的変数)1),ロジッ ト-2(期待値0.2,実測値(目的変数)0)ということで,いつの間にか期待値のロジットになっています。シュミレーションは実際に推定された偏回帰係 数,切片で行われるので,実は推定の段階から期待値のロジットをyにつかってるはずです。
だとすれば,最初の期待値のロジットはどこからきたので しょうか?ロジットの式をみると,p(期待値)に0や1を使うことはできませんので,0.05とか0.95を当てはめてるとしたら,期待値のロジットは目 的変数が0のとき-2.5,目的変数が1のとき2.5とかを機械的に当てはめてるのでしょうか?目的変数がほとんど50%の確率で1をとるならそれでもい いのでしょうが,上記のように20%しか1を取らないのであれば,それではいけないような気がします。
というのは,無謀にも観測変数にロジットを使って共分散構造分析をやろうと考えているところでして。
この辺の理屈に思いあたられることがございましたら,ご示唆いただければ幸いです。

No.08782 Re: 確率のロジットと期待値のロジット  【じぇいえす】 2008/12/28(Sun) 11:47

追伸いたしますと,いままで0,1の値しかない生データーをそのまま共分散構造分析にかけるという無謀なことをし ても,ある程度まともな結果がでたのは,0,1が期待値のロジットに対応した数字として働いていたからではないか,と思います。もちろん偏回帰係数は全く あてにはなりませんが,パスの関係性や相関構造はある程度参考にしていいのではないかと。

No.08784 Re: 確率のロジットと期待値のロジット  【青木繁伸】 2008/12/28(Sun) 15:48

仰っていることが,一部理解できないのですけど。。。

> p(期待値)に0や1を使うことはできませんので,0.05とか0.95を当てはめてるとしたら,期待値のロジットは目的変数が0のとき-2.5,目的変数が1のとき2.5とかを機械的に当てはめてるのでしょうか?

観測値の0/1に特定のロジットを割り当てて計算を進めるのではないですよ。

ロジットが線形式で表されると仮定して,実測値(0/1)に合うように(非線形最小二乗法で)線形式に含まれる係数を推定するわけです。
http://aoki2.si.gunma-u.ac.jp/lecture/Survival/mul-log.html

> あるソフトで

どういうソフトでしょうか?特に名を秘す必要があるのかなあ

No.08787 Re: 確率のロジットと期待値のロジット  【じぇいえす】 2008/12/28(Sun) 22:06

どうもありがとうございました。
回帰係数の推定の仕方を知らず,もうしわけありませんでした。ご紹介いただきましたページや他の非線形最小二乗法の関連ページを拝見し,期待値のロジットは係数の推定には必要ない,ということがわかりました。
ところで共分散構造分析をロジットのような対数の観測変数でおこなうことってできるんでしょうか?できればいいなと思います。

No.08788 Re: 確率のロジットと期待値のロジット  【青木繁伸】 2008/12/28(Sun) 22:11

> 共分散構造分析をロジットのような対数の観測変数でおこなうことってできるんでしょうか?

私もよく知りませんが,No. 8680 に関連するようなスレッドがあるような,ないような。

No.08791 Re: 確率のロジットと期待値のロジット  【じぇいえす】 2008/12/28(Sun) 23:43

コメント,ありがとうございました。
(ソフトはエクセル統計2006ですが,ソフトの問題ではないようでしたので。)

0,1だけのデーターに他の値を入れて共分散構造分析をしてみました。ダミー変数をつかうときなど,なにかの役に立つかもしれませんので,報告いたします。

まず0に-2.5,1に2.5を入れてみました。最尤法では答えが出ず,最小二乗法のみで答えが出ましたが,パス係数の符号はそろっていましたが,誤差がめちゃくちゃでかくなりました。
次に,0に0,1に0.5を入れて見ました。最尤法のdf/fはかえって大きくなりました。
その次は0に0.5,1に1.5を入れてみました。よく覚えていませんが,不適解だったような気がします。0,1に同じ符号のものを入れるのはよくないようです。
次は0に-0.2,1に0.8を入れてみました。0,1の場合とほとんど同じ結果でしたが,df/fは少し大きくなったようでした。
最後に0に-0.1,1に1.1を入れてみました。df/fが0,1の場合よりもちょっとだけ良くなったような,,

結論としては,別の数字(期待値のロジット?)にかえると,0,1の時より当てはまりがよくなる場合がある,かも。(共分散構造分析の場合は,結局,順位相関係数をつかって最尤法で推定した方が,はるかに良い結果になりそうでした。)

No.08793 Re: 確率のロジットと期待値のロジット  【青木繁伸】 2008/12/29(Mon) 00:16

> 0,1だけのデーターに他の値を入れて共分散構造分析をしてみました。

ということの,理論的根拠というか,意義がわかりません。

> まず0に-2.5,1に2.5を入れてみました

そのようにして,重回帰分析をしたということなんでしょうか?「共分散構造分析をした」とかいていますが,コンピュータ(そのソフト)は重回帰分析をしていると言うこと?
恣意的に用いた数値によって結果が異なるということは,そのようなことはしてはいけないと言うことでしょう?

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る