No.16817 標準化について  【R初心者】 2012/04/24(Tue) 08:59

いつもお世話になっておりまして,ありがとうございます。
住民健診での全国の市町村の例えばある疾患の指標値が,N≒1600で,正規分布の検定を行うと,正規分布とは言えません。
しかし以下のようなヒストグラムです。
この場合,標本調査ではなく全数調査であり,分布を正規分布としてz=(x-μ)/σで標準化して,左2.5%と右2.5%に属する地域を割り出すことは,行っても良いでしょうか?


No.16818 Re: 標準化について  【青木繁伸】 2012/04/24(Tue) 10:00

目的は,「左2.5%と右2.5%に属する地域を割り出す」ことなんですか?
値の大きい順に並べて,上からと下からぞれぞれ2.5%に入る地域を特定すればよいだけでしょう。正規分布でもないものを標準化得点を使って上下2.5%を抽出するのは,ナンセンスではないでしょうか?

No.16820 Re: 標準化について  【R初心者】 2012/04/24(Tue) 10:22

集団を標本集団と考えて,(x-μ)/σ/√nとして,数が多くなるのは,実験上個もましくないので,厳しい%にして数を減らすという手法が正しいのでしょうか?

No.16821 Re: 標準化について  【R初心者】 2012/04/24(Tue) 10:55

以下の手法の記述ではどうでしょうか?
正規分布への適合では,正規分布とは言えなかったが,ヒストグラムはほぼ正規分布の形をしており,データは標本調査ではなく全数調査であるので,分布を正規分布として,z=(x-μ)/σで標準化して,左2.5%と右2.5%に属する地域を割り出すことを行った。

No.16822 Re: 標準化について  【青木繁伸】 2012/04/24(Tue) 11:03

> 集団を標本集団と考えて,(x-μ)/σ/√nとして

いっている意味が分かりません。
なぜ,「値の大きい順に並べて,上からと下からぞれぞれ2.5%に入る地域を特定」がいけないのか,理由を述べてください。

No.16823 Re: 標準化について  【R初心者】 2012/04/24(Tue) 11:16

高血圧では,正常高値,軽症高血圧,中等度血圧,重度高血圧の4つの区分があります。
4つの区分でこの左2.5%(HL群)と右2.5%(HU群)の全地域に対する割合を比べたものが以下の図で,比べる必要があるために必要です。


No.16824 Re: 標準化について  【青木繁伸】 2012/04/24(Tue) 11:27

> 比べる必要があるために必要です。

おっしゃっていることがわかりません。
ので,ドロップアウトします。

No.16825 Re: 標準化について  【R初心者】 2012/04/24(Tue) 11:33

「値の大きい順に並べて,上からと下からぞれぞれ2.5%に入る地域を特定」を行うと,HL,HU群の割合は等しいものになります。正常高値ではHL群の割合が多いと言いたいのです。

No.16831 Re: 標準化について  【R初心者】 2012/04/25(Wed) 13:36

検定ではなく,分布からの地域を推定して割り出すための方法として使うのは,構わないという結論をいたしました。
色々,質問する中で,整理できました。まことにありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る