No.00620 区間予測の方法について  【夏維】 2006/07/11(Tue) 15:41

いつもお世話になっています.

下記のデータのように4ロットのデータを4つずつ取得した場合の区間予測の方法について教えてください.このデータの特性値の区間予測を行おうとしてますが,これまではデータすべてを使って単純にn=16のデータとして区間推定を行ってきました.
LOT	特性値
A 1.64
A 1.54
A 1.59
A 1.70
B 1.34
B 1.64
B 1.55
B 1.43
C 1.67
C 1.68
C 1.89
C 1.76
D 1.23
D 1.56
D 1.45
D 1.33
区間予測の公式は以下のものを使用しました.
標本平均−TINV(0.05,n-1)*s*√(1+1/n)〜標本平均+TINV(0.05,n-1)*s*√(1+1/n)

今まで通り,n=16で95%区間予測を行った場合
1.5625−TINV(0.05,16-1)*0.1729*√(1+1/16)〜1.5625+TINV(0.05,16-1)*0.1729*√(1+1/16)
で計算し,区間予測範囲は1.183〜1.942 となります.

しかし,ロットのバラツキに関しては4ロット分のデータしかありません.
ここで,ロット内とロット間のバラツキを分解してそれぞれ計算すると以下のようになります.
分散分析
要因        自由度   平方和  平均平方    F値
モデル           3  0.28935  0.096450  7.2815
誤差            12  0.15895  0.013246          p値(Prob>F)
全体(修正済み)  15  0.44830                    0.0049	
ここでロット内バラツキとロット間バラツキに分けて考えると,以下のようになります.
成分  分散成分推定値  標準偏差推定値  百分率
LOT間    0.020801         0.1442       61.1
LOT内    0.013246         0.1151       38.9
合計     0.034047         0.1845      100.0
ロット間バラツキが大きいが,ロット間バラツキに関しては4ロットしか情報がないので,ロット平均の区間予測を行うと当然,予測区間が広くなるのではないかと疑問に思いました.

実際に計算してみますとロット間のバラツキに関しては
標本平均は同じく1.5625ですが,標準偏差は0.1442となり,n=4なので,先ほどの式に代入すると
1.5625−TINV(0.05,4-1)*0.1442*√(1+1/4)〜1.5625+TINV(0.05,4-1)*0.1442*√(1+1/4)
となり,ロット平均の区間予測だけで1.049〜2.076で,n=16での区間予測の範囲より大きくなります.ここに,さらにロット内のバラツキが乗ってくるので,実際にはさらに広い範囲になります.

このような場合,ロット間とロット内のバラツキに分けて考えるやり方は感覚的には正しいのではないかと思いますが,統計の本にはこのような方法は書いてありません.

教えていただきたいこと
(1) このような考え方は正しいのか?
(2)もし正しいとしたら,ロット間とロット内のバラツキを考慮して区間予測を行うにはどうすればよいのか

よろしくお願いします.

No.00632 Re: 区間予測の方法について  【K.Hiro】 06/07/13(Thu) 07:18

一元配置分散分析の基本ですね。
分析の方法も,ロット内,ロット間の分散の求め方も問題無いでしょう。

ロット間,ロット内の考え方は管理図を勉強して下さい。管理図では群間変動,群内変動と言う言い方をしますが,ロットを群とすれば,理解出来るでしょう。

No.00633 Re: 区間予測の方法について  【夏維】 06/07/13(Thu) 08:43

お返事ありがとうございます.説明不足な点があるので補足します.

規格を設定するのに3ロット分データ取りを行いました.現状はこれ以上データが得られそうにありません.このデータから規格を設定したいのですが,ロット内とロット間のバラツキに分けたときにロット間のバラツキが大きいことが気になりました.

(1)ロット間のバラツキを小さくする算段が今のところ全く見あたらない
(2)規格設定の自由度が比較的高いと思われる

ということで,このデータで規格を設定してしまおうと考えています.

ということろでこの質問をさせていただいた次第ですが...

No.00637 Re: 区間予測の方法について  【K.Hiro】 06/07/14(Fri) 03:34

規格設定について
 規格は後工程,顧客からの要望で決めるものです。
しかし,その値から余裕があって,社内の管理目的で決める場合もありましょう。
そんな場合は,どれ位の管理幅なのかは経営的に決める事でしょう。
 ただ,統計的品質管理の観点からは,工程能力指数Cpの値から考慮すると一般的に4σで規格値を決めれば十分な工程能力指数が得られるでしょう。

 後は,求めたばらつきを基に計算をするのみでしょう。

規格の決め方の関してNo.411でも論議されてますから参考にされてはどうですか?

No.00639 Re: 区間予測の方法について  【夏維】 06/07/14(Fri) 10:20

だんだん本題からずれているようなのですが...

私が質問したのは,得られたデータのバラツキから区間推定するときに,その中のバラツキの構造を考慮して考えるべきではないか?ということです.

例えば,同じn=20のデータでも,2lot×10サンプルと5lot×4サンプルではデータの持つ情報量が異なるので,それに応じて解析すべきではないかということです.

質問がわかりずらかったですね.すみません.

No.00641 Re: 区間予測の方法について  【K.Hiro】 06/07/15(Sat) 06:23

各分散成分を正しく計算されているから,データの構造をご理解されている事と思っておりました。
分散分析の結果から推定するのは誤差(今回夏維さんのデータでは)ロット内変動を基に推定されこれを考慮した区間推定なのですね。
これにロット間を加えるか否かは,その目的で決める事なのですが,,

「ロット内とロット間のバラツキに分けたときにロット間のバラツキが大きいことが気になりました.」とありますから,通常実務者であれば,その気になった原因を追究して取り除く事を行うでしょう。
それが出来た場合は,ロット間変動を考慮する必要はありませんね。

そして,これがどうしても原因が把握出来なくてアクションで出来ない場合には,
「2lot×10サンプルと5lot×4サンプルではデータの持つ情報量が」
妥当なのかといった論議になるのでは無いですか?

または,夏維さんが気になる変動の量であっても,それが顧客は全く問題としないレベル例えば,10台くらいの変動も無視できるといった顧客とか後工程であれば,それを考慮したり,気になるからといってアクションをすることも完璧にムダでありオーバークヲリティですよね。

ゆえ,この辺りになると,それぞれの状況での事となりますので,これ以上はここで論議は難しいと思います。

● 「統計学関連なんでもあり」の過去ログ--- 038 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る