★ エクセルを使用したロジスティック回帰分析 ★

6906. エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/09 (木) 08:33
├6910. Re: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/09 (木) 16:24
│└6911. Re^2: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/09 (木) 16:42
│ ├6917. Re^3: エクセルを使用したロジスティック回帰分析 マスオ 2005/06/11 (土) 00:34
│ │├6931. Re^4: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 14:21
│ ││├6934. Re^5: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/14 (火) 15:30
│ │││├6947. Re^6: エクセルを使用したロジスティック回帰分析 kkk 2005/06/14 (火) 20:41
│ ││││└6955. Re^7: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/15 (水) 00:16
│ ││││ └6964. Re^8: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/15 (水) 09:05
│ │││└6935. Re^6: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 16:08
│ │││ └6944. Re^7: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/14 (火) 18:44
│ ││└6932. Re^5: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/14 (火) 14:44
│ ││ └6936. Re^6: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 16:26
│ ││  ├6943. Re^7: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/14 (火) 18:39
│ ││  ├6939. Re^7: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 17:55
│ ││  │└6942. Re^8: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/14 (火) 18:36
│ ││  │ └6946. Re^9: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 19:00
│ ││  │  └6970. Re^10: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/15 (水) 16:30
│ ││  │   ├6974. Re^11: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/15 (水) 19:32
│ ││  │   └6971. Re^11: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/15 (水) 16:30
│ ││  │    └6973. Re^12: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/15 (水) 19:00
│ ││  └6937. Re^7: エクセルを使用したロジスティック回帰分析 Shimp 2005/06/14 (火) 17:14
│ ││   └6938. Re^8: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 17:25
│ ││    └6940. Re^9: エクセルを使用したロジスティック回帰分析 Shimp 2005/06/14 (火) 18:08
│ ││     └6941. Re^10: エクセルを使用したロジスティック回帰分析 Shimp 2005/06/14 (火) 18:14
│ ││      └6945. Re^11: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/14 (火) 18:48
│ ││       └6957. Re^12: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/15 (水) 00:36
│ ││        ├6968. Re^13: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/15 (水) 11:40
│ ││        └6961. Re^13: エクセルを使用したロジスティック回帰分析 Shimp 2005/06/15 (水) 07:51
│ │└6918. Re^4: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/11 (土) 00:58
│ └6912. Re^3: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/09 (木) 17:00
│  └6914. Re^4: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/09 (木) 17:19
└6908. Re: エクセルを使用したロジスティック回帰分析 青木繁伸 2005/06/09 (木) 14:38
 └6909. Re^2: エクセルを使用したロジスティック回帰分析 亀田馬志 2005/06/09 (木) 15:10


6906. エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/09 (木) 08:33
初めまして。当方ただいまロジスティック回帰分析を独学しております。
今色々な統計関係のサイトを利用して勉強しているトコロなんですが,ドツボにハマっています。是非とも色々とご教授願えたら,と思った次第です。

ネットであるPDFを発見してその通りにエクセルを使用して例題を解いてみようと試みたのですが,これが全然分かりません。
例題は『最尤法によるロジスティック回帰分析』です。6個のp_iから未知のパラメーターb,c,を推定せよ,と言うモノです。
例題は『マウス実験に拠る毒物の容量に対する死亡率の変化』です。xは毒物の容量に対する対数になっています。

容量  x  r  n   p  推定p L
101 4.615 0  10  0.00  
136 4.913 2  10  0.20
183 5.209 5  10  0.50
247 5.509 8  10  0.80
333 5.808 9  10  0.90
450 6.109 10  10  1.00

              b=
              c=
              ΣL=

コレでp=1/【1+exp{−b(x−c)}】を二項分布に従った確率として最尤法で解いていけ,ってアウトラインです。
実際の手順としては次の様に書かれてますが・・・ツッコンで行きます。
(1)b,cの初期値を入力する。
とは言われてもその『初期値』ってのはどうやって決めてるんでしょうか?テキトーで構わないのでしょうか?どこにもそれに付いての解説は載ってません。
(2)推定pの列に1/【1+exp{−b(x−c)}】を入力する。
(3)L(対数尤度の列)にln(binomdist(r,n,推定p,false))を入力する。
(4)ΣLに対数尤度Lの合計を入力する。
(5)エクセルのソルバーを起動して,『目的セル』を『対数尤度の合計』に,『目的』を『最小値』に,『変化させるセル』をb,cに指定して実行する。

ところが『ERROR!!!』連発してお話にならないんです。
そして,『ERROR!!!』ながらでsも,色々『初期値』を変えて実験してみたんですが,『初期値』によって対数尤度の合計とかb,c,の値がバンバン変わっていきます。
こんな手法で構わないのでしょうか?是非ともご教授下さい。

     [このページのトップへ]


6910. Re: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/09 (木) 16:24
> (5)エクセルのソルバーを起動して,『目的セル』を『対数尤度の合計』に,『目的』を『最小値』に,

芳賀先生の原稿が間違えているようですが,目的は「最大値」にしないといけませんね。
対数尤度の和は負の符号なので,目的は絶対値を最小にするということなので,絶対値を取らないのなら,和を最大にしないといけません。

単に書かれてある通りやるのではなく,初期値をいろいろ変えて,そのときに目的の値がどう動くかを記録してみればすぐ,誤りに気づくのかもしれません。

また,初期値はいろいろ変えてみる訳ですが,変えた効果がすぐに目に見えるように,x と p の値とpの推定値をグラフに描くようにしておけばいいですね。Excel はその点,初期値を変えたらすぐにグラフが変わるので,便利です。

     [このページのトップへ]


6911. Re^2: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/09 (木) 16:42
> > (5)エクセルのソルバーを起動して,『目的セル』を『対数尤度の合計』に,『目的』を『最小値』に,
>
> 芳賀先生の原稿が間違えているようですが,目的は「最大値」にしないといけませんね。
> 対数尤度の和は負の符号なので,目的は絶対値を最小にするということなので,絶対値を取らないのなら,和を最大にしないといけません。
>
> 単に書かれてある通りやるのではなく,初期値をいろいろ変えて,そのときに目的の値がどう動くかを記録してみればすぐ,誤りに気づくのかもしれません。
>
> また,初期値はいろいろ変えてみる訳ですが,変えた効果がすぐに目に見えるように,x と p の値とpの推定値をグラフに描くようにしておけばいいですね。Excel はその点,初期値を変えたらすぐにグラフが変わるので,便利です。

丁寧な解説有り難う御座います。
『最大値』なんですね。なるほど。

ところでPDFでは

L(π)=COMBIN(n,x)*p^x*(1−p)^(n-x)

と記述されてますが,通常尤度関数は直積記号をΠとして

L(π)=ΠCOMBIN(n,x)*p^x*(1−p)^(n-x)

になるのではないのですか?
青木先生の『ベルヌーイ試行の尤度』の問題も読んだんですが,イマイチピンと来ません。
また,青木先生の『多重ロジスティックモデル』の記述も読みましたが,『Truett - Cornfield による判別係数を初期値とする』と書かれていましたが,コレって何なんでしょうか?ネット検索してみたんですが,1件も引っ掛からなかったんです。
基本的にどのサイト,書籍でも『SASを使用する』『SPSSを使用する』または計量経済学系のソフトを使用するって前提で書かれているので,ひょっとしてロジスティックモデル,ってのは素人には扱い辛い解析手法なんでしょうか?

エクセルでちょっと『初期値に関する』実験してみたいと思います。

     [このページのトップへ]


6917. Re^3: エクセルを使用したロジスティック回帰分析 マスオ  2005/06/11 (土) 00:34
この式での初期値の目安は,
bは 2.77/(x80-x20),ここでx80はpがおよそ0.8になるx,x20はpがおよそ0.2になるx.
cは x50,x50はpがおよそ0.5になるx.

あるいは,例示のExcelの表なら,
b0として F12に =-SLOPE(IF((E3:E8>0)*(E3:E8<1),LN(1/E3:E8-1)),B3:B8)
c0として F13に =INTERCEPT(IF((E3:E8>0)*(E3:E8<1),LN(1/E3:E8-1)),B3:B8)/F12
(いずれもCtrl+Shift+Enterで配列式入力)
とすると,値によらず自動で見積もってくれます.

     [このページのトップへ]


6931. Re^4: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 14:21
返信有り難う御座います。

色々調べてみたら,回帰分析ツールで求めた切片と傾きを初期値としても宜しいようですね。
上記のデータでは傾き0,切片0を初期値としても問題無く同様の答えが出ましたが,あんまり大きい値(例えば傾き35と切片35)なんてしたらバグります(笑)。面白いですね。何ででしょう(笑)?
現在は『ロジスティック多変量解析』をエクセル上でどうやってやるのか,に知恵を絞ってるんですが,コレがなかなか・・・・・・(苦笑)。ひょっとしたらエクセルで計算させるのは『単回帰』で限界かな,って感じているトコロです。

『R』ってのもダウンロードしてはみたんですが,イマイチ使い方が分かりません(笑)。ダウンロードにしても何か2つくらいアドインでファイル書き換えなきゃいけないらしいんですが,そのダウンロード先がおしゃかになってるようです。

     [このページのトップへ]


6934. Re^5: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/14 (火) 15:30
> あんまり大きい値(例えば傾き35と切片35)なんてしたらバグります(笑)。面白いですね。何ででしょう(笑)?

コンピュータは無限の大きさを持つ数を使えません。
exp 関数の引数が 709 のとき,すなわち exp(709)=8.2184E+307 で,このあたりがコンピュータが扱える最大の数です。
exp(710) は #NUM! になってしまいます。
バグではありません。コンピュータの限界です。
限界をわきまえて使わねばなりませんね。

     [このページのトップへ]


6947. Re^6: エクセルを使用したロジスティック回帰分析 kkk [URL]  2005/06/14 (火) 20:41
> コンピュータは無限の大きさを持つ数を使えません。
> exp 関数の引数が 709 のとき,すなわち exp(709)=8.2184E+307 で,このあたりがコンピュータが扱える最大の数です。
> exp(710) は #NUM! になってしまいます。
> バグではありません。コンピュータの限界です。
> 限界をわきまえて使わねばなりませんね。

ちなみに,浮動小数点数は表記ルールを決めた便宜的なビット列なので,ルール次第で無限大も扱える環境はあります。
数値を扱う上でエラーになるケースがなくなるだけで,万能なものではありませんが。
具体的には,次のような数値を導入して,無限大などを使えるように計算ルールが拡張されたものです。実装されたソフトウェアもあります。

inf
-inf
-0
NaN (たとえばinf - inf とか 0 / 0 とか inf / inf の計算結果)

     [このページのトップへ]


6955. Re^7: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/15 (水) 00:16
> ちなみに,浮動小数点数は表記ルールを決めた便宜的なビット列なので,ルール次第で無限大も扱える環境はあります。
> 数値を扱う上でエラーになるケースがなくなるだけで,万能なものではありませんが。
> 具体的には,次のような数値を導入して,無限大などを使えるように計算ルールが拡張されたものです。実装されたソフトウェアもあります。
>
> inf
> -inf
> -0
> NaN (たとえばinf - inf とか 0 / 0 とか inf / inf の計算結果)

って事はエクセルとかRではどうなんでしょう?

     [このページのトップへ]


6964. Re^8: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/15 (水) 09:05
> > inf
> > -inf
> > -0
> > NaN (たとえばinf - inf とか 0 / 0 とか inf / inf の計算結果)
>
> って事はエクセルとかRではどうなんでしょう?

R では,
> 10/0
[1] Inf
> -10/0
[1] -Inf
> Inf-Inf
[1] NaN
> sqrt(-5)
[1] NaN
> exp(1000)
[1] Inf

Excel はおやりになってみると良いと思いますが,
10/0 #DIV/0!
-10/0 #DIV/0!
sqrt(-5) #NUM!
exp(1000) #NUM!

Excel は poor です。

     [このページのトップへ]


6935. Re^6: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 16:08
> コンピュータは無限の大きさを持つ数を使えません。
> exp 関数の引数が 709 のとき,すなわち exp(709)=8.2184E+307 で,このあたりがコンピュータが扱える最大の数です。
> exp(710) は #NUM! になってしまいます。
> バグではありません。コンピュータの限界です。
> 限界をわきまえて使わねばなりませんね。

ああ,そうすると・・・・・・。
初期値を設定する,と言う条件が何故必要なのか,と言うのは数学理論的な要請では無いのですか?イマイチピンと来てなかったんですが・・・・・・。どっちかと言うと『実質的な計算方法』の要請,って考えてもイイのでしょうか?
要するに与えられた関数の全範囲にわたっては調べられないので,『この辺りだろう』ってアタリを付けてから演算させた方が効率的に探せる,と言う実用上の問題なんですか?その為に『初期値』ってのを与えてるんでしょうか?

     [このページのトップへ]


6944. Re^7: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/14 (火) 18:44
> 初期値を設定する,と言う条件が何故必要なのか,と言うのは数学理論的な要請では無いのですか?イマイチピンと来てなかったんですが・・・・・・。どっちかと言うと『実質的な計算方法』の要請,って考えてもイイのでしょうか?

http://aoki2.si.gunma-u.ac.jp/LaTeX/nonlinear.pdf
あたりを読んで頂けるとよいのかも。

     [このページのトップへ]


6932. Re^5: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/14 (火) 14:44
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/index.html
の,プログラムの42番は多重ロジスティック分析ですが。
R で書くと,
http://aoki2.si.gunma-u.ac.jp/R/index.html
の,多変量解析の8番ですが。

もちろん R に作りつけの関数を使ってもできますね。
余計な操作は何にも要らないはずですが,へんですね。

中澤港先生が作成したPDFの講義資料に,Rでの解析法がわかりやすく書いてあります。
http://phi.med.gunma-u.ac.jp/medstat/it12.pdf

     [このページのトップへ]


6936. Re^6: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 16:26
> http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/index.html
> の,プログラムの42番は多重ロジスティック分析ですが。
あ,こう言うエクセルでのプログラムを用意されてたんですか。知らなかったです(苦笑)。
なるほど。こうやってマクロってのは使うんですね。
コレは2変数以上でも構わないんでしょうか?
標準モジュールをエクセルに組み込めばイイのかな?
勉強になります。

> もちろん R に作りつけの関数を使ってもできますね。
> 余計な操作は何にも要らないはずですが,へんですね。
Rを起動すると

R : Copyright 2005, The R Foundation for Statistical Computing
Version 2.1.0 Patched (2005-04-20), ISBN 3-900051-07-0

のアトに『文字化け』が大量に出てきてワケが分からないのです(笑)。何故なんでしょうね?不思議です。

> 中澤港先生が作成したPDFの講義資料に,Rでの解析法がわかりやすく書いてあります。
> http://phi.med.gunma-u.ac.jp/medstat/it12.pdf
ありがとう御座います。参考にしてみます。

今Javaスクリプトで書かれたフリーソフトもチェックしてるトコロです。紹介しておきますね。

http://web.kyoto-inet.or.jp/people/t-kawano/

     [このページのトップへ]


6943. Re^7: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/14 (火) 18:39
> Rを起動すると
>
> R : Copyright 2005, The R Foundation for Statistical Computing
> Version 2.1.0 Patched (2005-04-20), ISBN 3-900051-07-0
>
> のアトに『文字化け』が大量に出てきてワケが分からないのです(笑)。何故なんでしょうね?不思議です。

Windows だからですね。
Macだと,ファイル一つをダウンロードして,インストールのためにクリックするだけです(^_^)


> 今Javaスクリプトで書かれたフリーソフトもチェックしてるトコロです。紹介しておきますね。
>
> http://web.kyoto-inet.or.jp/people/t-kawano/

それは,JavaScript ではなくて,Java ですね。
JavaScript で書いたものは,
http://aoki2.si.gunma-u.ac.jp/JavaScript/index.html
の,70番にあります(^_^)(^_^)V

     [このページのトップへ]


6939. Re^7: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 17:55
このエクセルの結果ですと,ロジットは

ln|p/(1-p)|=-5.645580693+0.008297108*X1+0.011386484*X2

なんですか?それとも

ln|p/(1-p)|=0.120347288*X1+0.56050067*X2

の方なんでしょうか?
『標準化偏回帰係数』って・・・?初めて聞きました。
どなたか解説宜しくお願いします。

     [このページのトップへ]


6942. Re^8: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/14 (火) 18:36
答えの分かっているデータを分析すればどちらか分かるかも。

     [このページのトップへ]


6946. Re^9: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 19:00
>>青木先生

僕も昔はMacとかAMIGAってヘンなパソコン(両方ともMC68xxx系)使ってたんですが(笑),時流に負けてすっかりWINDOWSです(笑)。
しかしながら別にMicrosoft評価してるワケでは全然無いんですがね(笑)。
TRONがパソコンのOSとして成功してたらなあ,とかたまに思います(笑)。TRONツブしたソフトバンクの孫社長もそれに関しては好意持ってませんね(笑)。
余談ですいません(苦笑)。

> 答えの分かっているデータを分析すればどちらか分かるかも。
ちょっとp式に直して調べてみます。

     [このページのトップへ]


6970. Re^10: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/15 (水) 16:30
ふ〜む・・・・・・。

某サイト:
http://www.fumotocpa.com/tousan3.htm
でのデータを見てみました。
ここでは『会社の倒産確率』をデータからロジスティック回帰分析で推定する試みを行っています。
変数には『自己資本比率』と『ICR(ってのが何を指すのかは知りませんが)』を用いています。
データは以下の通りです。(0は非倒産,1は倒産です。)

自己資本比率 ICR EndPoint
15.50% 1.14236025 1
5.60% 1.02979304 1
28.30% -0.4192361 1
12.70% -8.0454221 1
-78.70% 0.58308016 1
11.40% 2.3 0
13.70% 1.93 0
30.25% 2.426 0
34.06% 5.496 0
54.24% 7.76 0
52.23% 6.05 0
35.61% 6.31 0
36.47% 5.195 0
50.70% 22.36 0
46.80% 18.92 0
34.30% 3.21 0
33.40% 3.53 0
47.70% 3.91 0
38.10% -3.65 0

それでTSP Ver4.5なる財務ソフト(?多分)で解析を行った結果が以下の通りです。

Dependent variable: Y

Number of observations = 19 Scaled R-squared = .693065
Number of positive obs. = 5 LR (zero slopes) = 14.0403 [.001]
Mean of dep. var. = .263158 Schwarz B.I.C. = 8.34685
Sum of squared residuals = 1.39391 Log likelihood = -3.93019
R-squared = .621802
Fraction of Correct Predictions = 0.947368
Standard
Parameter Estimate Error t-statistic P-value
C 2.11596 2.00297 1.05641 [.291]
R -10.1892 8.65791 -1.17686 [.239]
ICR -.447479 .453128 -.987533 [.323]

     [このページのトップへ]


6974. Re^11: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/15 (水) 19:32
R では,以下のようになりました
prop は自己資本比率です

> df <- read.table("logit.dat", header=TRUE)
> result <- glm(EndPoint ~ prop+ICR, df, family=binomial)
> summary(result)

Call:
glm(formula = EndPoint ~ prop + ICR, family = binomial, data = df)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.1055683 -0.1187149 -0.0285075 0.0001349 1.6325543

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.6239 3.3424 1.084 0.278
prop -0.1759 0.1470 -1.197 0.231
ICR -0.7785 0.7442 -1.046 0.296

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 21.9007 on 18 degrees of freedom
Residual deviance: 7.9356 on 16 degrees of freedom
AIC: 13.936

Number of Fisher Scoring iterations: 9

     [このページのトップへ]


6971. Re^11: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/15 (水) 16:30
んでどう言う理由でどこから数字引っ張って来たんだか全然分からないんですが(苦笑),ロジットZはRを自己資本比率として

Z=3.62387−17.5852 *R−778477*ICR

と結論付けています。
同様のデータをここで紹介して頂いたエクセルで解析すると,

★ 多重ロジスティックモデル(Walker-Duncan 法) ★

有効ケース数 = 19
ネガティブケース = 14
ポジティブケース = 5

変数 平均値 標準偏差
自己資本比率 0.2644 0.294256513
ICR 4.212503961 6.865750882

対数尤度 -3.967807586

係数の推定値 偏回帰係数 標準誤差 t値 P値 標準化偏回帰係数
自己資本比率 -17.58520738 14.69542954 1.196644666 0.248876256 -5.174561808
ICR -0.778476607 0.74425644 1.045979 0.31111631 -5.344826452
定数項 3.623866064 3.342400277 1.084210676 0.294339202
t値の自由度 = 16

って事でロジットZは

Z=3.623866064-17.58520738*R-0.778476607*ICR

となって大体一致致しました。大体,ってのが困るんですがね(苦笑)。ICRの偏回帰係数の位がどう言うワケか喰い違ってます(笑)。
まあ,でもほぼOKなのかな?標準化偏回帰係数は何かの座標変換した場合の係数ですかね?多分。実用上は普通の偏回帰係数で構わないようなカンジがしました。

     [このページのトップへ]


6973. Re^12: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/15 (水) 19:00
> 標準化偏回帰係数は何かの座標変換した場合の係数ですかね?多分。実用上は普通の偏回帰係数で構わないようなカンジがしました。

偏回帰係数は,変数の単位や分散の大きさに依存します。また,そもそも長さと重さのような場合には相対比較できません。
標準化偏回帰係数は,独立変数を平均値0,分散1に標準化したときの偏回帰係数で,これは相互に比較できます(重回帰分析のとき都と違い,従属変数は標準化しなくてもよい)。

予測に使うのは偏回帰係数の方です。

#統計手法を使うときは,理論(計算方法ではない)を理解してからのほうが吉。

     [このページのトップへ]


6937. Re^7: エクセルを使用したロジスティック回帰分析 Shimp  2005/06/14 (火) 17:14
> R : Copyright 2005, The R Foundation for Statistical Computing
> Version 2.1.0 Patched (2005-04-20), ISBN 3-900051-07-0
>
> のアトに『文字化け』が大量に出てきてワケが分からないのです

http://www.okada.jp.org/RWiki/index.php?cmd=read&page=R-2.1.0%28Windows%29%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB%CA%FD%CB%A1

 ご覧になりましたか?

     [このページのトップへ]


6938. Re^8: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 17:25
> http://www.okada.jp.org/RWiki/index.php?cmd=read&page=R-2.1.0%28Windows%29%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB%CA%FD%CB%A1
>
>  ご覧になりましたか?
いや,初めて訪ねたHPです。
情報ありがとう御座います。
別のサイトだと2つくらいファイルをダウンロードして(Consoleと何か?)ファイルを置き換えろ,って指示されてたんです。(古いヴァージョンの説明なのかな?)
しかしどっちみちRdevgaってファイルはダウンロード不可・・・・・・。コレはTxtファイルで構わないんですかね?

     [このページのトップへ]


6940. Re^9: エクセルを使用したロジスティック回帰分析 Shimp  2005/06/14 (火) 18:08
> しかしどっちみちRdevgaってファイルはダウンロード不可

 いま,試してみたら普通に落とせました。

 もしもダメでも,\R\rw2010pat\etcフォルダのRdevgaファイルの中の,
TT Arial : plain
TT Arial : bold
TT Arial : italic
TT Arial : bold&italic

TT MS Gothic : plain
TT MS Gothic : bold
TT MS Gothic : italic
TT MS Gothic : bold&italic
と書き換えるだけですし,そもそもグラフィクスを使わないのならそれすら不要だった様に思います。

>・・・・・・。コレはTxtファイルで構わないんですかね?

もしも,.txtと拡張子を付けられてしまっても消すだけで問題ないと思います。

     [このページのトップへ]


6941. Re^10: エクセルを使用したロジスティック回帰分析 Shimp  2005/06/14 (火) 18:14
それと,先のRjpWikiではインストールコンポーネントの選択が「Chinese/Japanese/Korean installation」と説明されていますが,お使いの版(2.1.0 Patched)では,「Version for East Asian languages」となっているかと思います。
ご参考まで。

     [このページのトップへ]


6945. Re^11: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/14 (火) 18:48
>>Shimpさん

ありがとう御座います。
ちょっとファイルの中調べてみますね。
やる事多くてアップアップしております(苦笑)。

     [このページのトップへ]


6957. Re^12: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/15 (水) 00:36
う〜ん・・・。
Rに入ってるRdevgaファイルってのが開けないんですよね。
もう一回アクセスもしてみたんですが,『ダウンロード』にはならずに次のテキストが表示される“サイト”にアクセス出来るだけだったりします。
表示されてる情報は次の通りでした。(丸コピーです。)

# The system-wide copy is in rwxxxx/etc.
# A user copy can be installed in `R_USER'.

# Format is
# [TT] face:style
# where style is plain, bold, italic or bold&italic.
# If 'TT' is present, only True Type fonts are searched.
# Remarks:
# (a) Windows graphics engine can only rotate True Type fonts;
# (b) Only the first 32 fonts will be used.

TT MS Gothic : plain
TT MS Gothic : bold
TT MS Gothic : italic
TT MS Gothic : bold&italic

# Please, don't change the following definition. The plot math engine
# assumes that font5 contains greek letters and math symbols
TT Symbol: plain

TT Times New Roman : plain
TT Times New Roman : bold
TT Times New Roman : italic
TT Times New Roman : bold&italic
TT Courier New: plain
TT Courier New: bold
TT Courier New: italic
TT Courier New: bold&italic

TT Century Gothic : plain
TT Century Gothic : bold
TT Century Gothic : italic
TT Century Gothic : bold&italic

TT Matisse ITC: plain
TT Wingdings: plain

これは一体どうなってるのでしょうか?

     [このページのトップへ]


6968. Re^13: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/15 (水) 11:40
インストール法に従えばよいのでしょうが,
R2.1.0 からは,国際対応(日本語対応)になっただけですから(しかも,エラーメッセージだけ日本語),R1.9.1 を使えばいいのでは?
面倒くさかったら,Macを買うとか(^_^)

     [このページのトップへ]


6961. Re^13: エクセルを使用したロジスティック回帰分析 Shimp  2005/06/15 (水) 07:51
>Rに入ってるRdevgaファイルってのが開けないんですよね。

Windowsでは拡張子がついていないとダブルクリックではファイルは開けません。メモ帳から開いてみてください。

>もう一回アクセスもしてみたんですが,『ダウンロード』にはならずに次のテキストが表示される“サイト”にアクセス出来るだけだったりします。

Windowsなら,右クリックして「対象をファイルに保存」するとか,そのテキストをメモ帳に貼ってRdevgaというファイル名で保存するとかです。

     [このページのトップへ]


6918. Re^4: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/11 (土) 00:58
フォローありがとうございます。

数式を吟味して,妥当な初期値の目安を得るのも大事ですよね。
初期値の妥当性をグラフ的に確かめるということの前提として,今後意に留めておきたいと思います。

R の nls の auto start に,そのあたりの関係が書いてありました。

     [このページのトップへ]


6912. Re^3: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/09 (木) 17:00
> ところでPDFでは
>
> L(π)=COMBIN(n,x)*p^x*(1−p)^(n-x)
>
> と記述されてますが,

違うでしょう,G3〜G8に尤度ではなく対数尤度を求め,G11 にその和を求めると説明されていますね。


> 通常尤度関数は直積記号をΠとして
>
> L(π)=ΠCOMBIN(n,x)*p^x*(1−p)^(n-x)
>
> になるのではないのですか?

尤度はそうです。
対数尤度は log を取って Σ です。

     [このページのトップへ]


6914. Re^4: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/09 (木) 17:19
> 違うでしょう,G3〜G8に尤度ではなく対数尤度を求め,G11 にその和を求めると説明されていますね。

ああ,そうか。
何の為の『和を取る操作』なんだかイマイチピンと来なかったんです。
コレは通常の

L(π)=Πf(π)

からの対数取る操作

lnL(π)=Σlnf(π)

やってたんですね。なるほど。PDFの31ページ目の式(3,2)見て勘違いしてました。

エクセルで設定してみて成功しました。
なるほど。こうやって最尤法ってやるんですね。
スゴイ。納得です。初期値どれにしようと結果は変わらないようですね。ふ〜ん,これがロジスティック回帰分析の点推定か〜〜。面白いです(笑)。感動しました。本当に有り難う御座います。

今回は単回帰分析ですけど,疑問があって,原則的に操作は『多重ロジスティック回帰分析』でも変わらないんでしょうか?

     [このページのトップへ]


6908. Re: エクセルを使用したロジスティック回帰分析 青木繁伸  2005/06/09 (木) 14:38
> ネットであるPDFを発見してその通りにエクセルを使用して例題を解いてみようと試みたのですが,これが全然分かりません。

なぜ,その pdf がある URL を書かないのですか。
だれも,やってみることすらできないでしょう。

     [このページのトップへ]


6909. Re^2: エクセルを使用したロジスティック回帰分析 亀田馬志  2005/06/09 (木) 15:10
> なぜ,その pdf がある URL を書かないのですか。
> だれも,やってみることすらできないでしょう。

ダウンロードしてプリントアウトしたんで,元のページ忘れてたんです。探してみました。

http://www.yukms.com/biostat/haga/download/archive/likelihood/Likelihood.pdf

芳賀敏郎先生と仰る方のようですね。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 034 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る