No.21846 ロジスティック回帰分析の時のエクセルからのデータ入力  【R初心者】 2015/11/20(Fri) 11:14

いつもお世話になっております。以前質問
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc045/17353.html
しました。その節は,ありがとうございました。
エクセルからの使い方ですが,
x y
39.2964 0
43.2808 1
39.1153 0
のセルを選択し
d<-read.delim("clipboard")
とし
ans<-glm(y ~ x, d, family=binomial)では,前のような正しい結果が得られません。
上のようなエクセルデータを利用する場合,どうするのでしょうか?

No.21847 Re: ロジスティック回帰分析の時のエクセルからのデータ入力  【R初心者】 2015/11/20(Fri) 11:28

実際のサンプルです。
x y
39.2964 0
43.2808 1
39.1153 0
38.9163 0
38.2939 0
45.0221 1
38.5792 0
35.7308 0
41.1779 1
39.0925 0
39.0529 0
35.9808 0
38.5518 0
39.507 0
40.0184 1
39.4895 0
42.835 1
38.7532 0
37.0281 0
41.0135 1

No.21851 Re: ロジスティック回帰分析の時のエクセルからのデータ入力  【青木繁伸】 2015/11/20(Fri) 13:39

「正しい結果が得られません。」というのは,どういう状況でしょう?
エラーメッセージが出ていると思いますが。

No.21853 Re: ロジスティック回帰分析の時のエクセルからのデータ入力  【R初心者】 2015/11/20(Fri) 14:36

> ans <- glm(y ~ x, d, family=binomial)
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
です。

No.21854 Re: ロジスティック回帰分析の時のエクセルからのデータ入力  【青木繁伸】 2015/11/20(Fri) 17:24

ですよね。
fitted probabilities numerically 0 or 1 occurred
というのは,
> table(d$x<40, d$y)

0 1
FALSE 0 6
TRUE 14 0
こういうことを警告しているのです。つまり,x が 40 未満のものは全員 y = 0,40 以上のものは全員 y = 1 ですよということ。で,パラメータは不定になり求められない。

このデータではそうなります。
以前の質問と同じデータですので,以前も同じ状況になったはずで,そのため,私はデータを少し換えて分析例を示しました。
>> 投稿されたデータは分析できないので,ちょっと変更して分析します。

貴方の示したデータの20番目のケースの y を 0 に変更したデータだと,以下のように正常に分析できます。
         x y
1 39.2964 0
2 43.2808 1
3 39.1153 0
:
20 41.0135 0 <=== ★★ このデータの y を 1 から 0 に変更 ★★
>
> ans<-glm(y ~ x, d, family=binomial)
> summary(ans)

Call:
glm(formula = y ~ x, family = binomial, data = d)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.49156 -0.27280 -0.15769 -0.00239 1.78123

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -84.648 43.083 -1.965 0.0494
x 2.081 1.071 1.943 0.0521

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 22.4934 on 19 degrees of freedom
Residual deviance: 6.8427 on 18 degrees of freedom
AIC: 10.843

Number of Fisher Scoring iterations: 7

No.21856 Re: ロジスティック回帰分析の時のエクセルからのデータ入力  【R初心者】 2015/11/25(Wed) 10:41

先生の言われていることが,確認できました。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る