No.05005 対数正規分布と標準偏差  【NOTE】 2007/12/10(Mon) 17:29

部材強度が最大値となるときの変形量Xの分布について調べています。

XおよびY=LN(X)(自然対数)の2通りで度数分布図を描いたところ,対数正規分布に従うと考えました。同時に,データをグルーピングすると,特徴がありそうなことが分かりました(グループによって算術平均が異なるため)。

各グループの特徴は,過去の事例に倣い,平均値M,標準偏差SDおよび変動係数COVで表現しようとしています。

あるグループに対する指標は次のとおりでした。
Xに対する値:M(X)=0.058,SD(X)=0.052,COV=0.90
Y=LN(X)に対する値:M(Y)=-3.16,SD(Y)=0.81,

この場合,過去の事例では,
「データは対数正規分布に従い,平均値0.058,標準偏差0.052である。期待値は平均値±90%位の幅がある」
というような表現をしていますが,正規分布でない集団の標準偏差を示すことに意味がないように思えたので,次の表現がよいのではないかと考えました。

「データは対数正規分布に従い,平均値0.042,約70%のデータが0.019〜0.095の範囲にある」(数値は,対数の平均および平均±標準偏差を逆変換した値)

この表現の方が妥当であると言えるでしょうか。
また,M±SDの範囲が正負非対称となりますが,グループ間のばらつきの大きさを比較するにはどのような表現を用いるのが一般的でしょうか。
対数のままでは工学的な意味が不明となってしまうので,実際の数値Xで表現するすべを知りたいと思っています。

No.05006 Re: 対数正規分布と標準偏差  【青木繁伸】 2007/12/10(Mon) 17:38

> 「データは対数正規分布に従い,平均値0.042,約70%のデータが0.019〜0.095の範囲にある」(数値は,対数の平均および平均±標準偏差を逆変換した値)

> この表現の方が妥当であると言えるでしょうか。

そのとおりです

> グループ間のばらつきの大きさを比較するにはどのような表現

四分偏差というのがあります
(第3四分位数-第1四分位数)/2
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/sibun-hensa.html

No.05009 Re: 対数正規分布と標準偏差  【NOTE】 2007/12/10(Mon) 19:45

早々のご指南ありがとうございました。
おかげさまでかなり前進しました。

追加でお力添えを頂ければ幸いです。

>そのとおりです

Q1
では,ある集団の平均値,標準偏差および変動係数を示した上で,この値についてコメントし,この集団は対数正規分布であると述べた文章は,間違いなのでしょうか。
もしくは,何らかの補足説明によって救われるのでしょうか。
実は,私の周りには,この手のレポートが多く,これらが間違いだとすれば,結構ショックです。


>四分偏差というのがあります

Q2
この場合,「四分偏差/幾何平均」を指標にはしないのでしょうか。

変動係数に毒されているのでしょうか。平均値の異なる複数の集団のばらつきの大きさを比較するとき,どうしても平均値で割り算したくなってしまいます。

Q3
とある論文中に,表で与えられた次の表現を見つけました。
「変数1:平均値M1,変動係数COV1,正規分布
 変数2:平均値M2,変動係数COV2,対数正規分布」

変数2に対する上記表現は,平均値,変動係数が対数変換した値に対するものであれば,妥当なのでしょうか。

四分偏差はどうした?とお叱りを受けそうですが,私の周囲ではなじみがない指標なので,可能ならばと馴染み深い変動係数に未練を残しています。

No.05010 Re: 対数正規分布と標準偏差  【青木繁伸】 2007/12/10(Mon) 21:34

> ある集団の平均値,標準偏差および変動係数を示した上で,この値についてコメントし,この集団は対数正規分布であると述べた文章は,間違いなのでしょうか。

対数正規分布であろうと,何分布であろうと,そのデータについて平均値,標準偏差を記述するのが間違いではないでしょう。ただ,その平均値,標準偏差は,元の分布が正規分布の場合にのみ適正な意味を持つと言うことです。
分布が対数正規分布であると言ったとたんに,平均値と標準偏差の持つ意味は違ってきます。(対数正規分布であるなら,対数変換した後のデータについての平均値,標準偏差なら本来の意味通りの意味を持つわけです)。

> 「四分偏差/幾何平均」を指標にはしないのでしょうか。

しませんね(そういう利用法はみたことがありません)
四分偏差は,いわばノンパラメトリックな(この場合は,正規分布を仮定しないというくらいのいみですが)指標ですね。四分偏差でなくても範囲(最大値-最小値)でも良いのですが,外れ値の影響を避けるために第1,3四分位数を使うんでしょう。

変動係数っていうのは,この掲示板にも何回も書いたことですが,「実に使いでのない統計量」なんですね。

> 四分偏差はどうした?とお叱りを受けそうですが,私の周囲ではなじみがない指標なので

どこでもそうですよ。
別に,四分偏差をお勧めしているわけではありません。

No.05012 Re: 対数正規分布と標準偏差  【おちょぼ】 2007/12/10(Mon) 23:52

「Xの変動係数≒Ln(X)の標準偏差(※)」という性質があるので,変動係数は対数正規分布のばらつきを示す指標として使いでがあると思うのですが・・・

(※)参考
http://www.snap-tck.com/room04/c01/stat/stat0202.html

No.05016 Re: 対数正規分布と標準偏差  【NOTE】 2007/12/11(Tue) 18:26

いろいろとありがとうございました。1日悩んでみました。

対数正規分布に従うことに忠実であり,かつ偉人の既往の成果(考察手法)に擦り付けるために,次の用語を定義して表現することにしました。

1.Ln(X)の平均値mを逆変換した値e^m:幾何平均値GM
2.GMと(Ln(X)の平均値m±標準偏差SDを逆変換した値)との差分=e^(m±SD)-e^m:(±)標準偏差相当値SD'(±)

また,なるべく使用しないよう心がけますが,GMの値が異なるグループ間のばらつきの大きさを比較する際,SD'では困難が予想されるので,いざとなったら,
(±)SD'/GM:変動係数相当値(±)
も準備したいと思います。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る