No.04706 ヒストグラムと正規分布の乖離  【Az】 2007/11/15(Thu) 16:06

青木先生,上記の問題についてお教え下さい
 Excelのヒストグラム作成ツールを用いて,中性脂肪の検査結果を20代の男性100人のサンプルデータからグラフを作成しました。

 これに正規分布の値をもとめて,ヒストグラムの図に追加して複合グラフにしました。(平均:122.2 標準偏差:79.86 尖度:2.29 歪度:1.44です。)グラフはF分布らしきものが出てきます。(ズブの素人ですので,形状については怪しげです)
 
  健康診断の検査結果には平均値を「基準値」とし,平均値±2SDを基準範囲とするというものがあります。また「血液成分の検査結果は正規分布あるいは対数 正規分布に近い形を示す」ともいいます。ちなみに,中性脂肪の基準範囲(正常値)は30〜149です。(150〜299は要指導,300以上は要治療とな ります)

 20代男性のサンプルデータからは,「基準範囲」は122.2±79.86*2で0〜282となります。医療界で定義されている基準範囲は「犯しがたい」規範ですので,何ともいえないのですが,『随分違うなー』という印象を持ちます。

 それは別として,正規分布の曲線とヒストグラムの棒グラフの頂点がある程度近接するかと思っていたのですが,中性脂肪に関しては大分ずれが目立つのです。

 これには,何らかの統計学的理由があるのでしょうか?お手数ですが,理由をお教え頂けないでしょうか。宜しくお願い致します。


No.04707 Re: ヒストグラムと正規分布の乖離  【青木繁伸】 2007/11/15(Thu) 18:02

図として貼り込まれたものの数値が小さく不鮮明で,よくわかりませんが。

「血液成分の検査結果は正規分布あるいは対数正規分布に近い形を示す」と言いながら,なぜ正規分布に当てはめてみたのでしょうか。
ヒストグラムを見る限り,正規分布とは言えない(対数正規分布かと言われれば,確証はないですが,正規分布だと言うよりはましなような)

No.04711 Re: ヒストグラムと正規分布の乖離  【AzHama】 2007/11/16(Fri) 13:52

青木先生,早速ご返事頂き有難うございます。
 正規分布に当てはめたのは,単に「尖度」「歪度」の影響だろう位に思った
からに過ぎません。また,対数正規分布は重ね描きの方法が分かりませんでし
たので,試すこともありませんでした。

 ヒストグラムに何らかの統計的分布図が追加できれば良いなと考えています。
対数正規分布図も調べてみましたが,似ているものもありそうですので,データ
の算出方法等をお教え頂けると幸いです。

 なまた,添付図の数値に関しましては,再度,添付図の大きさを変えて貼り付
けました。容量に制限がありますので,この辺りが限度です。

 それでは,宜しくお願い致します。


No.04712 Re: ヒストグラムと正規分布の乖離  【AzHama】 2007/11/16(Fri) 14:56

青木先生,重ね重ね済みません。
2005年の過去ログに重ね書きに関する先生のお答えが
ありました。質問者のわたなべさんと同様に,私もRを
使ったことがありませんので,Excelで試してみます。

No.04713 Re: ヒストグラムと正規分布の乖離  【青木繁伸】 2007/11/16(Fri) 15:41

一つの図にして貼り込むからだめなんですね。
読めるだけの精度を持った図に分割して投稿すればよい。
ただ,今回の問題を解決するには,度数分布がわかるだけではだめだろう。
元データが必要。

No.04718 画像資料送付1)  【azHama】 2007/11/17(Sat) 01:46

青木先生,再度,ご指摘有難うございます。

 自宅に戻り,先生と渡辺さんのQ&Aを
読み直していますが,Rを使ってグラフを
重ね書きできるようになるには時間がかか
りそうです。
 若し,お手数でなければ,データを使って
ご検討して頂けないでしょうか。

 画像資料送付1)です。


No.04719 画像資料送付2)  【azHama】 2007/11/17(Sat) 01:48

男女年代別のグラフです。


No.04720 CSVデータ送付えらーにつき  【azHama】 2007/11/17(Sat) 01:57

青木先生,100人分の各サンプルデータを
送ろうとしましたが,アップロードエラーが
表示されます。

 ちなみに,100×4=400人分データは9K
 約1万人の全体データは77Kです。

CSV形式のデータを送付するやり方はないものでしょうか。

No.04721 Re: ヒストグラムと正規分布の乖離  【青木繁伸】 2007/11/17(Sat) 16:49

普通のcsvファイルを添付ファイルに指定しても,そんなことはできないようにしてあります。そのまんま,コメン ト欄にコピーペーストすればよいわけですが,まあ,100人分のデータならともかく,1万人のデータをコピーペーストされると迷惑ですので,ご遠慮しま す。どうしても送付したいのなら,私宛のメールに添付すればよいかとは思いますが,それも遠慮したいなあ。

No.04722 Re: ヒストグラムと正規分布の乖離  【青木繁伸】 2007/11/17(Sat) 18:19

やってみると実に簡単だったので。
fit.lognorm(データベクトル)というように使う。
fit.lognorm <- function(x, ...)
{
y <- log(x)
m <- mean(y)
s <- sd(y)
hist(x, freq=FALSE, ...)
x2 <- seq(0, max(x), length.out=200)
y2 <- dlnorm(x2, m, s)
lines(x2, y2, col="red")
}
x <- c(56, 101, 139, 35, 107, 110, 72, 72, 72, 63, 74, 60, 66, 92, 132, 86, 73,
63, 64, 237, 95, 74, 75, 108, 68, 50, 113, 60, 89, 62, 140, 74, 68, 74, 47, 56,
38, 53, 80, 75, 161, 59, 64, 80, 60, 61, 58, 55, 73, 74, 44, 71, 58, 60, 84,
113, 174, 66, 171, 57, 117, 250, 89, 69, 90, 183, 57, 156, 153, 103, 90, 75,
78, 117, 206, 85, 52, 67, 100, 79, 84, 84, 52, 84, 126, 119, 112, 77, 83, 56,
88, 100, 178, 134, 74, 104, 57, 128, 133, 210, 106, 74, 92, 74, 65, 96, 63, 96,
104, 88, 83, 69, 58, 126, 91, 126, 55, 96, 118, 89, 83, 66, 205, 122, 187, 93,
70, 49, 70, 99, 135, 100, 56, 118, 47, 78, 79, 41, 130, 70, 79, 157, 116, 86,
111, 106, 175, 101, 110, 103, 77, 94, 173, 63, 95, 155, 82, 59, 64, 77, 64, 81,
76, 84, 106, 116, 176, 88, 79, 162, 178, 92, 79, 43, 158, 64, 57, 304, 99, 89,
30, 86, 133, 106, 130, 199, 144, 73, 119, 83, 73, 29, 66, 109, 214, 110, 115,
61, 96, 39)
fit.lognorm(x, ylim=c(0, 0.015))
上の例だと次のようなグラフが描ける。


● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る