No.04707 Re: ヒストグラムと正規分布の乖離 【青木繁伸】 2007/11/15(Thu) 18:02
図として貼り込まれたものの数値が小さく不鮮明で,よくわかりませんが。
「血液成分の検査結果は正規分布あるいは対数正規分布に近い形を示す」と言いながら,なぜ正規分布に当てはめてみたのでしょうか。
ヒストグラムを見る限り,正規分布とは言えない(対数正規分布かと言われれば,確証はないですが,正規分布だと言うよりはましなような)
No.04711 Re: ヒストグラムと正規分布の乖離 【AzHama】 2007/11/16(Fri) 13:52
青木先生,早速ご返事頂き有難うございます。
正規分布に当てはめたのは,単に「尖度」「歪度」の影響だろう位に思った
からに過ぎません。また,対数正規分布は重ね描きの方法が分かりませんでし
たので,試すこともありませんでした。
ヒストグラムに何らかの統計的分布図が追加できれば良いなと考えています。
対数正規分布図も調べてみましたが,似ているものもありそうですので,データ
の算出方法等をお教え頂けると幸いです。
なまた,添付図の数値に関しましては,再度,添付図の大きさを変えて貼り付
けました。容量に制限がありますので,この辺りが限度です。
それでは,宜しくお願い致します。
No.04712 Re: ヒストグラムと正規分布の乖離 【AzHama】 2007/11/16(Fri) 14:56
青木先生,重ね重ね済みません。
2005年の過去ログに重ね書きに関する先生のお答えが
ありました。質問者のわたなべさんと同様に,私もRを
使ったことがありませんので,Excelで試してみます。
No.04713 Re: ヒストグラムと正規分布の乖離 【青木繁伸】 2007/11/16(Fri) 15:41
一つの図にして貼り込むからだめなんですね。
読めるだけの精度を持った図に分割して投稿すればよい。
ただ,今回の問題を解決するには,度数分布がわかるだけではだめだろう。
元データが必要。
No.04718 画像資料送付1) 【azHama】 2007/11/17(Sat) 01:46
青木先生,再度,ご指摘有難うございます。
自宅に戻り,先生と渡辺さんのQ&Aを
読み直していますが,Rを使ってグラフを
重ね書きできるようになるには時間がかか
りそうです。
若し,お手数でなければ,データを使って
ご検討して頂けないでしょうか。
画像資料送付1)です。
No.04719 画像資料送付2) 【azHama】 2007/11/17(Sat) 01:48
男女年代別のグラフです。
No.04720 CSVデータ送付えらーにつき 【azHama】 2007/11/17(Sat) 01:57
青木先生,100人分の各サンプルデータを
送ろうとしましたが,アップロードエラーが
表示されます。
ちなみに,100×4=400人分データは9K
約1万人の全体データは77Kです。
CSV形式のデータを送付するやり方はないものでしょうか。
No.04721 Re: ヒストグラムと正規分布の乖離 【青木繁伸】 2007/11/17(Sat) 16:49
普通のcsvファイルを添付ファイルに指定しても,そんなことはできないようにしてあります。そのまんま,コメン ト欄にコピーペーストすればよいわけですが,まあ,100人分のデータならともかく,1万人のデータをコピーペーストされると迷惑ですので,ご遠慮しま す。どうしても送付したいのなら,私宛のメールに添付すればよいかとは思いますが,それも遠慮したいなあ。
No.04722 Re: ヒストグラムと正規分布の乖離 【青木繁伸】 2007/11/17(Sat) 18:19
やってみると実に簡単だったので。
fit.lognorm(データベクトル)というように使う。fit.lognorm <- function(x, ...)上の例だと次のようなグラフが描ける。
{
y <- log(x)
m <- mean(y)
s <- sd(y)
hist(x, freq=FALSE, ...)
x2 <- seq(0, max(x), length.out=200)
y2 <- dlnorm(x2, m, s)
lines(x2, y2, col="red")
}
x <- c(56, 101, 139, 35, 107, 110, 72, 72, 72, 63, 74, 60, 66, 92, 132, 86, 73,
63, 64, 237, 95, 74, 75, 108, 68, 50, 113, 60, 89, 62, 140, 74, 68, 74, 47, 56,
38, 53, 80, 75, 161, 59, 64, 80, 60, 61, 58, 55, 73, 74, 44, 71, 58, 60, 84,
113, 174, 66, 171, 57, 117, 250, 89, 69, 90, 183, 57, 156, 153, 103, 90, 75,
78, 117, 206, 85, 52, 67, 100, 79, 84, 84, 52, 84, 126, 119, 112, 77, 83, 56,
88, 100, 178, 134, 74, 104, 57, 128, 133, 210, 106, 74, 92, 74, 65, 96, 63, 96,
104, 88, 83, 69, 58, 126, 91, 126, 55, 96, 118, 89, 83, 66, 205, 122, 187, 93,
70, 49, 70, 99, 135, 100, 56, 118, 47, 78, 79, 41, 130, 70, 79, 157, 116, 86,
111, 106, 175, 101, 110, 103, 77, 94, 173, 63, 95, 155, 82, 59, 64, 77, 64, 81,
76, 84, 106, 116, 176, 88, 79, 162, 178, 92, 79, 43, 158, 64, 57, 304, 99, 89,
30, 86, 133, 106, 130, 199, 144, 73, 119, 83, 73, 29, 66, 109, 214, 110, 115,
61, 96, 39)
fit.lognorm(x, ylim=c(0, 0.015))
● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る