No.14273 ポアソン分布を仮定した回帰モデルの誤差を明示的に書く場合の書式  【Sai】 2011/02/01(Tue) 03:00

いつもお世話になっております。
ネット,過去ログを検索しましたが見当たらなかったので質問させてください。
質問は,ポアソン分布の誤差を明示的に書いた場合のモデル式はどのように書けばよいかです。別に論文執筆やその他の目的で明示的に書こうとしているわけではなく,あくまで勉強のためです。

例えば,誤差に正規分布を仮定したモデルだと,
Y = a + bX + e
e ~ N(0, sigma^2)

Y:応答変数
a:切片
b:傾き
X:共変量のデザインマトリックス
e:誤差項
N:正規分布
sigma^2:分散
等という風に書くと思います。
一方でポアソン分布の場合は,
Y = Poisson(Lambda)
Lambda = a + bX

Lambda:ポアソン分布の平均値と分散を表すパラメータ
としている式は見かけるのですが,それ以外は見つけることが出来ませんでした。
平均と分散が等しいという性質上,明示的に書くとすれば,Yが非負となるようにパラメータを調整するとして,
Y = a + bX + e
e ~ Poisson(lambda = (a + bX)) - mean(a + bX)

mean:平均値
とでも書くのか,と考えました。一応,シミュレーションで確認したところ,ぴったり同じ結果になるようです。
a <- 1
b <- 2
x <- sample(50, 200, rep=T)
y <- a + b*x
plot(x, y, type="l", col=2)

iter <- 100
mat_pois <- matrix(NA, iter, length(y))
for (i in 1 : length(y)) {
mat_pois[, i] <- rpois(iter, lambda=y[i])
}
D <- data.frame(X=rep(x, each=iter), c(mat_pois))
points(D)

Y <- rep(y, each=iter)
E <- c(mat_pois)-Y
points(rep(x, each=iter), Y+E, col=3, pch=16, cex=0.3)
ただ,周りにこのような質問を相談出来る人がおらずこの理解で合っているのかが不安で,この掲示板に投稿させていただいた次第です。どなたか,この関係が成り立たない場合やこの理解で合っていると思うなど,ご意見を頂ければ幸いに思います。どうぞよろしくお願い致します。

No.14275 Re: ポアソン分布を仮定した回帰モデルの誤差を明示的に書く場合の書式  【知ったかぶり】 2011/02/01(Tue) 18:13

>Y = a + bX + e
>e ~ Poisson(lambda = (a + bX)) - mean(a + bX)

mean(a + bX) というのは, a + bX そのものですから(そもそもこのような定式化において,「サンプル平均」が使われるということはないと思いますが),この式は, Y = Poisson(lambda = (a + bX)) です.

>E <- c(mat_pois)-Y
>points(rep(x, each=iter), Y+E, col=3, pch=16, cex=0.3)

Y + E = c(mat_pois) なので,「ぴったり同じ結果になる」のは当然です.

No.14276 Re: ポアソン分布を仮定した回帰モデルの誤差を明示的に書く場合の書式  【Sai】 2011/02/01(Tue) 18:29

知ったかぶりさん,返信ありがとうございました。

> mean(a + bX) というのは, a + bX そのものですから(中略)この式は, Y = Poisson(lambda = (a + bX)) です.

ということで,
a + bX - mean(a + bX) + Poisson(lambda = (a + bX)) = Poisson(lambda = (a + bX))
ということですね。
まぁぴったり同じ結果になるのは当然なのですが,念のためと自分の理解のため,でした。
ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る