No.08280 Rでいうprobについて  【ねこ】 2008/11/18(Tue) 20:15

とても初歩的な質問ですが,アドバイスいただけないでしょうか?

二項分布の乱数を発生させる関数は,rbinom(n, size, prob)とありました。
このprobは確率という意味だと思うのですが,どのように計算すればいいのでしょうか?
私の持つデータは,
1頭あたりの子の数で,0頭,1頭,2頭と数え,最大2頭までです。
これは,2頭になる確率,1頭になる確立,0頭になる確率と3通りあるため,どれを入れていいのかわかりません。
例題では,コインの表裏の確率などでしたが,上限は決まっているけど複数通りある場合は,確率はどのように算出するのでしょうか?

簡単な質問かもしれませんが,助けて下さい。お願いいたします。

No.08281 Re: Rでいうprobについて  【青木繁伸】 2008/11/18(Tue) 21:20

prob は,実際のデータに合うように推定しないといけないものですね。
prob=0.1, 0.2, ..., 0.9 までに変えて,size=2, n=10000の二項乱数を発生させて集計すると以下のようになります。
> tbl <- sapply(seq(0.1, 0.9, by=0.1), function(p) table(rbinom(10000, 2, prob=p)))
> colnames(tbl) <- seq(0.1, 0.9, by=0.1)
> tbl
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0 8106 6368 4891 3568 2503 1603 871 376 96
1 1816 3179 4201 4830 4991 4816 4261 3204 1802
2 78 453 908 1602 2506 3581 4868 6420 8102
では,どのようにprobを推定するかというと,説明は
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/kaitou-1.html
実際に計算するのはまあ,コンピュータを使うと言うことで
http://aoki2.si.gunma-u.ac.jp/R/binomdist.html
などを使って,推定します。例えば上の結果の観測値 (4891, 4201, 908) これは,母比率が 0.3 のときの観測値ですが,この標本から母比率を推定してみましょう。
> binomdist(c(4891, 4201, 908), 0:2, 2)
$result
サンプルサイズ 母比率
1.0000e+04 3.0085e-01

$table
度数 確率 期待値
0 4891 0.48881072 4888.1072
1 4201 0.42067856 4206.7856
2 908 0.09051072 905.1072

$result2
カイ二乗値 自由度 P値
0.01891423 1.00000000 0.89061267
ということで,母比率が 3.0085e-01 と推定されましたと言うことです。
(母比率の推定値は, (0*4891+1*4201+2*908)/10000/2 で求まりますということ)

No.08282 Re: Rでいうprobについて  【ねこ】 2008/11/18(Tue) 23:33

ご回答をいただきまして,ありがとうございます。

大変わかりやすい説明をいただいて,おかげさまでprobの意味と計算方法がわかりました。
適当な数字を入れて計算してしまうところで,本当に勉強になりました。
ありがとうございます。これからも掲示板で勉強させていただきたく思います。
ありがとうございます。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る