★ バラツキの分布について ★

3651. バラツキの分布について phoo 2004/07/11 (日) 18:36
├3659. Re: バラツキの分布について 青木繁伸 2004/07/12 (月) 15:00
└3653. Re:バラツキの分布について ひの 2004/07/11 (日) 22:20
 └3656. Re^2:バラツキの分布について phoo 2004/07/12 (月) 01:53
  └3657. Re:バラツキの分布について ひの 2004/07/12 (月) 10:42
   └3668. Re^2:バラツキの分布について phoo 2004/07/13 (火) 05:42
    └3673. Re:バラツキの分布について ひの 2004/07/13 (火) 15:38
     └3682. Re^2:バラツキの分布について phoo 2004/07/14 (水) 06:19


3651. バラツキの分布について phoo  2004/07/11 (日) 18:36
はじめまして。
ある材料の変形量のバラツキを測定したら,平均値=0.43,標準偏差=0.28 でした。
この結果から,
(1)分布をグラフ化し,
(2)変形量がある範囲に入る確率を計算したいのですが,
正規分布曲線を描くとマイナスの範囲が出ますが,変形量なので0以上の正数となります。±2σ,3σ・・・等で算出できません。
このような場合は,どう考えればよいのでしょうか?
初歩的で,恥ずかしいのですがよろしくお願いします。

     [このページのトップへ]


3659. Re: バラツキの分布について 青木繁伸  2004/07/12 (月) 15:00
> ある材料の変形量のバラツキを測定したら,
> 平均値=0.43,標準偏差=0.28 でした。

この結果から見て,このデータが正規分布に従わないということが想像されますが。つまり,この平均値と標準偏差を持つ正規分布は0以下の値をとる確率は理論的には 0.0668ほどあるのに,実際には負の値はあり得ないということですから,実際のデータは正規分布に従っていないということです。左裾よりも右の裾が長い分布。

ひのさんのコメントもありましたが,ヒストグラムをちゃんと描いてみましょう。
ヒストグラムを描くと,それが正規分布に従うものか,さらには,正規分布に従うと見なしてさらなる推論が許されるのかを判断する,重要な手がかりになるでしょう。

     [このページのトップへ]


3653. Re:バラツキの分布について ひの  2004/07/11 (日) 22:20
 分布のグラフは書いてみたのでしょうか?それともグラフの書き方が分からないのでしょうか?

  「変形量」をどのように求めたのか説明がありませんので推測に基づいて書きますが,変形量を計算する前の段階の生データで処理したほうがよいと思います。 変形量にする段階でデータの正負の情報が消えて,元のデータより情報量が減ってしまっている可能性があるからです。たとえば「3mm太くなった」のも 「3mm細くなった」のも一緒くたに「変化量3mm」というような扱いになってしまっているのではないですか?

     [このページのトップへ]


3656. Re^2:バラツキの分布について phoo  2004/07/12 (月) 01:53
早速,回答ありがとうございます。
うまく説明できなくて申し訳ありません。

>  分布のグラフは書いてみたのでしょうか?それともグラフの書き方が分からないのでしょうか?

はい,グラフの書き方がよく分かりません。
横軸に,サンプル数(n),縦軸に変形量をプロットした折れ線グラフ(管理図のようなもの)は描いてみました。

もうひとつ,横軸に変形量,縦軸に「平均値」「標準偏差」から求めた確率密度関数の値をプロットしてみました。
この正規分布のグラフが横軸マイナス領域に入りますが,実際には,マイナスは発生しないのです。


>「変形量」をどのように求めたのか説明がありませんので・・・

「変形量」とは,板材の一方向への曲がりの寸法で,求め方は100のサンプルを実測して求めた生データです。

>たとえば「3mm太くなった」のも「3mm細くなった」のも一緒くたに「変化量3mm」というような扱いになってしまっているのではないですか?

変形量=0 が正規の状態で,ある工程を通過することで一方向に変形が発生します。逆方向がマイナスなのですが,工程上マイナス方向の変形は,発生し得ないのです。

この生データから,±3σ 相当(99.7%)のバラツキを想定する為に,分布をグラフ化し,変形量の管理範囲を求めたいのですが・・・

     [このページのトップへ]


3657. Re:バラツキの分布について ひの  2004/07/12 (月) 10:42
> はい,グラフの書き方がよく分かりません。
> 横軸に,サンプル数(n),縦軸に変形量をプロットした折れ線グラフ(管理図のようなもの)は描いてみました。

まずデータの分布の形を見てみる必要があります。そのためにはヒストグラム(度数分布図)というグラフをを描きます。変形量を適当な階級に区切ってその階級に収まるデータ数をカウントして度数分布表を作り,それをもとにグラフを書きます(階級を横軸に,各階級に収まるデータの数(度数)を縦軸に)。サンプルが100あるということなので,このヒストグラムを見れば正規分布に近似するのが適当なのかどうか見当がつきます。

> 変形量=0 が正規の状態で,ある工程を通過することで一方向に変形が発生します。逆方向がマイナスなのですが,工程上マイナス方向の変形は,発生し得ないのです。

マイナスの値がない理由は分かりました。変形量0(測定限界以下)というデータはありますか?それがかなりあるようでしたら,変形量の上限値の範囲を推定するだけの作業ということになると思います。

> この生データから,±3σ 相当(99.7%)のバラツキを想定する為に,分布をグラフ化し,変形量の管理範囲を求めたいのですが・・・

分布を適当な理論分布関数に当てはめることができればよいのですが,そうでない場合はちょっと面倒ですね。たとえばサンプル数を10000に増やすことが可能なら,1万サンプルのデータから大きいほうから15サンプル,小さいほうから15サンプル取り除いて残ったデータの範囲が,確率99.7%の範囲であるというような推定をすることはできます。ただしこの方法は多量のサンプルを要する割には精度が高くありません。


     [このページのトップへ]


3668. Re^2:バラツキの分布について phoo  2004/07/13 (火) 05:42
ひの さん
丁寧なご説明,ありがとうございます。

> まずデータの分布の形を見てみる必要があります。
> そのためにはヒストグラム(度数分布図)というグラフを描きます。
> 変形量を適当な階級に区切ってその階級に収まるデータ数をカウント
> して度数分布表を作り,それをもとにグラフを書きます(階級を横軸
> に,各階級に収まるデータの数(度数)を縦軸に)。
> サンプルが100あるということなので,このヒストグラムを
> 見れば正規分布に近似するのが適当なのかどうか見当がつきます。

早速,正規分布表と重ねて,ヒストグラムを作成してみました。
サンプル数が少ないせいか,少し凸凹がありますが,ほぼ近似していました。

> マイナスの値がない理由は分かりました。変形量0(測定限界以下)
> というデータはありますか?それがかなりあるようでしたら,変形量
> の上限値の範囲を推定するだけの作業ということになると思います。

変形量0(測定限界以下)のデータは,4%あります。
従って,計算から求めた正規分布曲線もこの点で,縦軸と交差します。

> 分布を適当な理論分布関数に当てはめることができればよいのですが,
> そうでない場合はちょっと面倒ですね。

上記のヒストグラムとの近似の目視をもって,正規分布に当てはめることは
かなり乱暴な行為なのでしょうか。

> たとえばサンプル数を10000に増やすことが可能なら,
> 1万サンプルのデータから大きいほうから15サンプル,
> 小さいほうから15サンプル取り除いて残ったデータの範囲が,
> 確率99.7%の範囲であるというような推定をすることはできます。

よくわかりました。1万サンプルは現実問題 難しいのですが,できるだけ増やしてやってみます。
いろいろと,有難うございました。

     [このページのトップへ]


3673. Re:バラツキの分布について ひの  2004/07/13 (火) 15:38
> 早速,正規分布表と重ねて,ヒストグラムを作成してみました。
> サンプル数が少ないせいか,少し凸凹がありますが,ほぼ近似していました。

> 変形量0(測定限界以下)のデータは,4%あります。

 それなら,正規分布か,切断正規分布に近似してよさそうですね。0〜上限値 という範囲の推定になると思います。

> 上記のヒストグラムとの近似の目視をもって,正規分布に当てはめることはかなり乱暴な行為なのでしょうか。

 測定値の性質から,何らかの理論分布に従うと考えることができる場合はその分布に従うかどうか見てみればよいのですが,そうでなければ,まずは正規分布に近似してみるのが穏当でしょう。正規分布とみなしてよいかどうかの検定のしかたは,以下のページを参考にしてください。

http://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/normaldist.html

     [このページのトップへ]


3682. Re^2:バラツキの分布について phoo  2004/07/14 (水) 06:19
ひの さん
いろいろとありがとうございます。

>それなら,正規分布か,切断正規分布に近似してよさそうですね。
>0〜上限値 という範囲の推定になると思います。
>・・・
>測定値の性質から,何らかの理論分布に従うと考えることができる場合はその分布に従うかどうか見てみればよいのですが,そうでなければ,まずは正規分布に近似してみるのが妥当でしょう。

はい,サンプル数を1000程度に増やして確認した上で,この方向で進めようと思います。 (サンプル取りに数日かかるのですが・・・)


>正規分布とみなしてよいかどうかの検定のしかたは,以下のページを参考にしてください。
> http://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/normaldist.html

こういう検定があるんですね。びっくりです。
と言っても,まだ中身はよく理解できていません。
(本当に素人なんです)
この機会に,じっくり理解しておきたいと思いますので,頭の整理をして,またわからないところは質問します。(別スレッドの方がいいですね)よろしくお願いします。

本当に,いろいろと有難うございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 029 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る