No.08490 データを関数へのあてはめについて  【R初心者】 2008/12/03(Wed) 14:31

以下のような,右に偏った一見正規分布のような,XY平面の,データがあります。
ガンマ関数かな,と思いますが,どのようにして,モデル式を求めたらよいのでしょうか?


No.08493 Re: データを関数へのあてはめについて  【青木繁伸】 2008/12/03(Wed) 15:19

縦軸は何なのでしょうか(ついでに,常識だといわれるかもしれないが横軸も)

No.08494 Re: データを関数へのあてはめについて  【R初心者】 2008/12/03(Wed) 16:01

縦軸は,疾病増加率(推定の発生率)で,×1000の値です。横軸は,年齢です。モデルは,一番上のデータで,高齢者で,負の値になっていないデータを用いたいです。

No.08497 Re: データを関数へのあてはめについて  【青木繁伸】 2008/12/03(Wed) 19:03

理論的に考えて,ガンマ分布になるんですか?単に似ていると思うだけ?
でも,ガンマ分布って,右裾が長いんじゃなかったかなあ?
それに,正の部分だけを用いたいというのも,理論的根拠に欠けると思います。
少なくとも,増加率よりは発生率を対象にしたほうがよいのではないかと思います。

No.08499 Re: データを関数へのあてはめについて  【R初心者】 2008/12/04(Thu) 08:50

1)お返事,ありがとうございます。確かに,ガンマ関数は,右裾が長いと思います。何か,変数を変えることで,左裾が長くなるのかな,と思ったのですが。
2)これは,疾病の発生シミュレーションにモデル式の数値を用いたいと,思ったからです。死亡率のほうは,y=a*x^2+b*xの2次関数で何とかモデル関数を作成できました。
残りは,疾病の発生モデルとしての,図のデータからの,モデル式です。ガンマ関数にはこだわりません。何か良い関数モデルがないでしょうか?
http://www.med.nihon-u.ac.jp/department/public_health/ebm/ce310.html
がヒントになるのかもしれません。y=e^(ax+b)でならないのか?

No.08501 Re: データを関数へのあてはめについて  【R初心者】 2008/12/04(Thu) 11:35

EXCELで,多項式によるあてはめを行ったところ,
y = 2E-09x6 - 6E-07x5 + 5E-05x4 - 0.0022x3 + 0.0451x2 - 0.4009x + 1.1595
の式で,結構あてはまるモデルができました。


No.08507 Re: データを関数へのあてはめについて  【R初心者】 2008/12/04(Thu) 16:12

お忙しいところ,すみません。
回帰曲線近似式をRで求めるには,具体的にどうすればよいのでしょうか?
x 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
y 4.68503E-06 -4.18479E-06 1.66852E-05 6.38494E-05 0.000105166 0.000181349 0.000317737 0.000415458 0.00094516 0.001555657 0.001939267 0.003108122 0.001846695 0.002000665 0.000724911 0
です。xの6次式で求めたいのですが,EXCELでの式は,正確ではなく,困っています。

No.08508 Re: データを関数へのあてはめについて  【青木繁伸】 2008/12/04(Thu) 16:32

Excel は使用に耐えません。

あまり,こういうことはお勧めできないような気がしますけど,
> x
[1] 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
> y
[1] 4.685030e-06 -4.184790e-06 1.668520e-05 6.384940e-05 1.051660e-04
[6] 1.813490e-04 3.177370e-04 4.154580e-04 9.451600e-04 1.555657e-03
[11] 1.939267e-03 3.108122e-03 1.846695e-03 2.000665e-03 7.249110e-04
[16] 0.000000e+00
> ans <- lm(y ~ I(x^6)+I(x^5)+I(x^4)+I(x^3)+I(x^2)+x)
> summary(ans)

Call:
lm(formula = y ~ I(x^6) + I(x^5) + I(x^4) + I(x^3) + I(x^2) +
x)

Residuals:
Min 1Q Median 3Q Max
-5.403e-04 -6.393e-05 -2.985e-05 7.223e-05 6.124e-04

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.159e-03 1.364e-03 0.850 0.4173
I(x^6) 2.423e-12 1.156e-12 2.096 0.0655 .
I(x^5) -5.894e-10 2.956e-10 -1.994 0.0773 .
I(x^4) 5.317e-08 2.926e-08 1.817 0.1026
I(x^3) -2.226e-06 1.410e-06 -1.579 0.1488
I(x^2) 4.507e-05 3.394e-05 1.328 0.2169
x -4.009e-04 3.719e-04 -1.078 0.3091
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0003018 on 9 degrees of freedom
Multiple R-squared: 0.9418, Adjusted R-squared: 0.9029
F-statistic: 24.25 on 6 and 9 DF, p-value: 4.503e-05

> options(digits=22, width=80)
> coefficients(ans)
(Intercept) I(x^6) I(x^5)
1.159457048692122e-03 2.423496362985648e-12 -5.893754597503524e-10
I(x^4) I(x^3) I(x^2)
5.317461207198154e-08 -2.225791928134675e-06 4.506757331006036e-05
x
-4.008539829030279e-04

No.08518 Re: データを関数へのあてはめについて  【R初心者】 2008/12/05(Fri) 08:53

ご回答,ありがとうございます。EXCELでもできました。近似曲線ラベルの書式設定で,細かく有効数字を設定すれば,得られました。先生の出してくださった結果と,ほとんど同じです。
先生の行ったRの計算についてlmやlmでのIの使い方,options,について,参考WEBがありましたら,教えてください。ありがとうございました。

No.08537 Re: データを関数へのあてはめについて  【青木繁伸】 2008/12/05(Fri) 23:32

コメントの追加があったのですね。

> lmやlmでのIの使い方,options,について,参考WEBがありましたら

オンラインヘルプの参照,すなわち,?im, ?I で得られると思います。
lm については,example(lm) で,実行例も見られると思います。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る