No.01486 変動する比率の区間推定  【kzkishi】 2006/11/01(Wed) 20:41

質問させて頂きたいのですが,業務上の問題であり,ディテールを脚色して記載させて頂きます。
なるべく質問したい状況自体は変わらないよう気をつけたのですが,不自然な点はご容赦下さい(タイトルも変ですみません)。

ある企業で,ある製品を作る工場が沢山あり,これからも増える予定,とします。
今,そのうち30ヶ所で抜き打ち検査があり,各工場で製品3000個のうち何個,不良品があるか調べられたとします。
このとき,各工場での母不良率の信頼区間は二項分布から計算できるかと思います。

このデータから,全工場での母不良率の信頼区間(最も悪い工場での母不良率はどの程度,最も良い工場ではどの程度)を求めたいのですが,どのようにしたら良いものか悩んでいます。
得られた30ヶ所の工場のデータうち,最も不良品が少なかった工場での信頼区間下限,最も多かった工場の上限,とするのでは,いささか心もとない気がします。
というか,それは一体,何%信頼区間になるのか悩ましいです。
全工場での母不良率が正規分布に従うと仮定して,今あるデータから計算した正規分布の信頼区間上限・下限での不良率を求め,それらの不良率から更に比率の信頼区間上限・下限を求める,とか…。
ただ,正規分布に従うことを仮定する・支持する根拠は,特にないので,どうしたものか。。

どなたか,お知恵を頂けないでしょうか。

No.01551 Re: 変動する比率の区間推定  【ファン】 2006/11/08(Wed) 14:35

技術的なことは詰めてないですが,,,

それって,「下位5%の工場はこんなに不良品が多い」とか「本社が品質を上げようとして的外れな指示を出すものだから,忠実な現場は混乱して,良かった工場までこんなに不良品が増えてる」とかの話ですよね。

だったら「信頼区間」の話ではなくて,分布推定と標本誤差の話になると思います。

No.01557 Re: 変動する比率の区間推定  【K.Hiro】 2006/11/09(Thu) 11:22

母集団をどう考えるか?
固有技術的に全ての工場を一つの母集団と考えられるか?
考えられないのであれば,これをまとめて推定するのはナンセンス。
それぞれで層別してそれぞれで管理しなければ無意味ですね。

一つの母集団と考えられるならば,サンプリング法の本を読んでどういったサンプリングが良いかを検討して下さい。
やはり実務者であれば,コストパーフォマンスの良いサンプリングで目的のデータを得たい訳ですから。

No.01566 Re: 変動する比率の区間推定  【kzkishi】 2006/11/09(Thu) 15:07

返信ありがとうございます。

>だったら「信頼区間」の話ではなくて,分布推定と標本誤差の話になると思います。

今あるデータから本来の分布を推定して,その分布に基いて話をする。
その時の推定の精度は,標本誤差の程度によって,この程度です,という但し書きのようなものを付ける。
という意味で合っているでしょうか。
なるほど,意味なく正規分布と仮定するのではなくて,分布を推定する,という発想はありませんでした。
ありがとうございます,勉強してみます。

>母集団をどう考えるか?
>固有技術的に全ての工場を一つの母集団と考えられるか?

難しいご質問ですが…,今のところ考えられると仮定しています(ご指摘あるまで無意識的に仮定していました)。

>一つの母集団と考えられるならば,サンプリング法の本を読んでどういったサンプリングが良いかを検討して下さい。

ありがとうございます。
そうですね,先に目的から方法を検討して,それに基いてデータを取得するのがスジでした。
今からでも勉強してみます(頭を下げて,もう一回調べてもらえるよう頼んでみます)。

No.01576 Re: 変動する比率の区間推定  【ファン】 2006/11/12(Sun) 02:59

工場間比較(工場を単位とする不良品率の分布)が不要で,製品を標本単位とする全製品の不良品率の推定が調査目的なら,二段抽出法になりますね。
つまり1段目は工場をランダムに選び,二段目は各工場から製品をランダムに選ぶ。
集計する時には,各工場毎のある期間(週,月など)における製造量を重みにした加重平均値によって,全製品の不良品率(の推定値)を計算する。標本調査法の本を見れば,標本誤差の推定式が出ていると思いますよ。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る