★ 再現性と変動係数について ★

6365. 再現性と変動係数について アスモハレ 2005/04/04 (月) 01:06
└6366. Re: 再現性と変動係数について 青木繁伸 2005/04/04 (月) 09:20
 ├6379. Re^2: 再現性と変動係数について アスモハレ 2005/04/04 (月) 23:08
 │└6380. Re^3: 再現性と変動係数について 青木繁伸 2005/04/04 (月) 23:34
 │ └6382. Re^4: 再現性と変動係数について 青木繁伸 2005/04/04 (月) 23:46
 │  └6384. Re^5: 再現性と変動係数について 青木繁伸 2005/04/05 (火) 11:13
 └6367. Re^2: 再現性と変動係数について 青木繁伸 2005/04/04 (月) 10:03
  └6387. Re^3: 再現性と変動係数について Hi☆Rose 2005/04/05 (火) 19:13
   ├6418. Re^4: 再現性と変動係数について ひの 2005/04/08 (金) 09:22
   │└6448. Re^5: 再現性と変動係数について Hi☆Rose 2005/04/14 (木) 23:10
   └6389. Re^4: 再現性と変動係数について 青木繁伸 2005/04/05 (火) 21:25


6365. 再現性と変動係数について アスモハレ  2005/04/04 (月) 01:06
統計の基礎が良くわかっていないと言われそうで大変恐縮ですが,
変動係数(CV%,RSD)について教えて頂ければ幸いです。

今,ガスクロの分析で得た面積値を解析しようとしています。
そのときの再現性として,変動係数が使えるかなと思っています。

求め方としては,
n 面積
1 5000 
2 5000
3 5500
4 6000
5 6000
というデータの場合,平均(Average)が5500,標準偏差(STDEV)が500となり,CV%=500/5500×100=9.1%となるかと思います。
(求め方は間違ってないですよね?)

この9.1%にどのような意味があるのかが良くわかりません。
何%以内だったら,信頼区間はどのくらいになるのでしょうか?。

また,平均面積が550000(先ほどの100倍)のとき,CV%が9.1%だとしたら,再現性は同じということでよいのでしょうか?
私の感覚では,面積値が100倍でCV%が同じなのだから再現性は悪いような気がします。

このような場合に,同じ土俵で比較したい場合はどうしたらよいのでしょうか?。
標準化(基準化)を行ってから,CV%を求めた方が良い気がしています・・・。
(しかし,標準化するとCV%は,Ave.が0になってしまうことから計算不能に・・・)
CV%は,既に標準化された値なのでしょうか?

チェビシェフの不等式も関係がありそうだなぁとも思ってます。
関係はないのでしょうか?
再現性の評価は”CV”で定義していいものか,迷っており,以上の関係がまとまりつかない状況です。。。

ご助言の程,よろしくお願いします。

     [このページのトップへ]


6366. Re: 再現性と変動係数について 青木繁伸  2005/04/04 (月) 09:20
> そのときの再現性として,変動係数が使えるかなと思っています。

使えないでしょう。変動係数は,統計学の中で一番使いでのない統計量ではないでしょうか。

> また,平均面積が550000(先ほどの100倍)のとき,CV%が9.1%だとしたら,再現性は同じということでよいのでしょうか?
> 私の感覚では,面積値が100倍でCV%が同じなのだから再現性は悪いような気がします。

要するに,変動係数は再現性を表さないからです。評価の基準に使えません。

> 標準化(基準化)を行ってから,CV%を求めた方が良い気がしています・・・。
> (しかし,標準化するとCV%は,Ave.が0になってしまうことから計算不能に・・・)
> CV%は,既に標準化された値なのでしょうか?

標準化されたものではないというか,標準化という意味は?

そもそも,計算式に平均値と標準偏差が入るわけですから,両方が比例して変化するような変数変換以外では,変換前と変換後のデータのCVは値が変わってしまいます。
以下の3つの場合にCVを求めてみてください。
x1 = 1, 3, 2, 5 のとき
x2 = 10, 30, 20, 50 のとき
x3 = 11, 31, 21, 51 のとき
値が変わると言うことは,それを悪用すれば,どんな結果でも出せるということ(望ましい結果の出るような変数変換をすればよい)。そんな便利な魔法のような手法はまゆつばというか使えませんよね。

> チェビシェフの不等式も関係がありそうだなぁとも思ってます。
> 関係はないのでしょうか?

ないと思いますが。

> 再現性の評価は”CV”で定義していいものか,迷っており,以上の関係がまとまりつかない状況です。。。

あなたの「再現性」の定義をまず聞かせてもらう必要がありますね。

     [このページのトップへ]


6379. Re^2: 再現性と変動係数について アスモハレ  2005/04/04 (月) 23:08
貴重なお時間を割いて頂き,本当にありがとうございます。
大変参考になっておりますが,まだまだ,ピンとこない点があり,再度質問させて頂いてもよろしいでしょうか。

> > そのときの再現性として,変動係数が使えるかなと思っています。
>
> 使えないでしょう。変動係数は,統計学の中で一番使いでのない統計量ではないでしょうか。
>
> > また,平均面積が550000(先ほどの100倍)のとき,CV%が9.1%だとしたら,再現性は同じということでよいのでしょうか。
> > 私の感覚では,面積値が100倍でCV%が同じなのだから再現性は悪いような気がします。
>
> 要するに,変動係数は再現性を表さないからです。評価の基準に使えません。

私は,機器分析で数回同様に行った分析結果に対し,再現性(精度)があるのかを判断したいのです。

たとえば,水質検査の精度として,次のように厚生労働省の方から定められています。

<水質検査の精度>
 機器分析の精度としては,基準値及び目標値の1/10 の定量下限値が得られ,下限値付近
の測定において,変動係数(測定値のばらつき)が金属類では10%以下,また有機物では20
%以下の検査を行います。

ということでしたので,変動係数が再現性と同義的使われているような気がしました。
この法律での変動係数は,評価基準の一つになっているように思えますが,このような使い方は有効な手法なのでしょうか?

また,いろんな分析化学の論文や分析メーカーのデータを見てもCV%が掲示されている場合があります。
これらのときの変動係数は,深い意味もなく慣例的に掲載されているということになるのでしょうか。

統計学的な再現性というものは,どのように定義すればよいのでしょう。。。。
すごく悩んでます。

> 標準化されたものではないというか,標準化という意味は?

ある本に,違う次元にある数値を比較する際には,得られた数値を平均値で差し引けば良い,このことを標準化と呼ぶと書かれていました。使い方を間違えたかもしれません。

     [このページのトップへ]


6380. Re^3: 再現性と変動係数について 青木繁伸  2005/04/04 (月) 23:34
> たとえば,水質検査の精度として,次のように厚生労働省の方から定められています。

その場合にはそのように定めていると言うことです。

水質検査の精度と,ある学科試験の精度や,林床検査値の精度を同じように定められるとお考えでしょうか。

> ある本に,違う次元にある数値を比較する際には,得られた数値を平均値で差し引けば良い,このことを標準化と呼ぶと書かれていました。使い方を間違えたかもしれません。

先ほどの例で,言えば,摂氏で測られた温度と華氏で測られた温度は担任平均値の調整だけでは比較できません。

更に言えば,ある大学の入試で,英語で受験したものと数学で受験したものの合格判定では,平均値と標準偏差で調整して合否判定を行うことなどはできません。


あ る特定の測定値は,たとえば,ある特定の(というか正常範囲内の)飲料水中のトリハロメタンの測定値は,平均値も標準偏差もある一定範囲にあるということ でしょう。両者の比をとってもある一定範囲にはいっているでしょう。その範囲からはみ出すような測定値はある意味,異常なんでしょう。しかし,同じ水でヒ 素の含有量を測ったときの変動係数は,トリハロメタンの変動係数と同じなんでしょうか?同じであるなら,何らかの関係式が導かれるでしょうから,トリハロ メタンを測ればヒ素の含有量は測らなくても分かるということでしょうか。。。違うんでしょうね。

     [このページのトップへ]


6382. Re^4: 再現性と変動係数について 青木繁伸  2005/04/04 (月) 23:46
> > たとえば,水質検査の精度として,次のように厚生労働省の方から定められています。
> > この法律での変動係数は,評価基準の一つになっているように思えますが,このような使い方は有効な手法なのでしょうか?

その分野では有効なんでしょうね。きっと。

> また,いろんな分析化学の論文や分析メーカーのデータを見てもCV%が掲示されている場合があります。

測定対象によって決まっているのだと思いますよ。

先のコメントにも述べましたように,たとえば温度管理で,摂氏で測ったときと華氏で測ったときとで変動係数が違うということについては,どのように解釈なさるのでしょうか?どちらかに決めれば良いといわれればそうなんでしょうが。釈然としませんね。

> これらのときの変動係数は,深い意味もなく慣例的に掲載されているということになるのでしょうか。

その測定値についてはそのような変動係数になるということだけではないですか?
どんな測定値についても変動係数は本来同じ値なんてことがあるとは思えませんが。

> 統計学的な再現性というものは,どのように定義すればよいのでしょう。。。。

ですから,あなたが定義する再現性はどのようなことですかと聞いているのです。

同 じものを2回ずつ測ったとしたら,一番目の測定値の平均と二回目の測定値の平均が有意な差ではない(対応のある検定)という風にするのかどうかとか。本来 同じ値であるはずの測定値を何回も測ったとき,その分散が有る範囲以内にあるか(母分散の検定)とか,平均値も含めての話なのか(たとえば,正規分布に適 合しているかとか),再現性といっても,定義はいろいろあるのではないですかということですが。

     [このページのトップへ]


6384. Re^5: 再現性と変動係数について 青木繁伸  2005/04/05 (火) 11:13
対応のある平均値の差の検定をして,差が大きくないことだけで安心してはいけない。

相関係数を求めることも必要だ

x1 87 90 101 109 113
x2 83 98 100 109 111

X1 113 87 109 101 90
X2 98 100 111 109 83

     [このページのトップへ]


6367. Re^2: 再現性と変動係数について 青木繁伸  2005/04/04 (月) 10:03
蛇足ですが

> そもそも,計算式に平均値と標準偏差が入るわけですから,両方が比例して変化するような変数変換以外では,変換前と変換後のデータのCVは値が変わってしまいます。

そんな変換はないだろうとお思いかもしれませんが,温度を摂氏で表すか華氏で表すかで,同じデータでも変動係数が違うということを挙げておきましょう。

     [このページのトップへ]


6387. Re^3: 再現性と変動係数について Hi☆Rose  2005/04/05 (火) 19:13
> そんな変換はないだろうとお思いかもしれませんが,温度を摂氏で表すか華氏で表すかで,同じデータでも変動係数が違うということを挙げておきましょう。
 そもそもCV自体が比例尺度で定義されていると考えるのが妥当ではないでしょうか。定義上,ゼロが必要ですから。。。
>CV%は,既に標準化された値なのでしょうか?
 標準化というのが,”そのデータの単位に依存しない”という意味でしたら,標準化された値といえるのではないでしょうか。

     [このページのトップへ]


6418. Re^4: 再現性と変動係数について ひの  2005/04/08 (金) 09:22
> >CV%は,既に標準化された値なのでしょうか?
>  標準化というのが,”そのデータの単位に依存しない”という意味でしたら,標準化された値といえるのではないでしょうか。

CV値はデータの単位(次元)に依存します。何度かここで書きましたが,同じデータを周期(秒)で表現するか,その逆数である周波数(Hz)で表現するかによってCV値は異なります。

     [このページのトップへ]


6448. Re^5: 再現性と変動係数について Hi☆Rose  2005/04/14 (木) 23:10
> CV値はデータの単位(次元)に依存します。何度かここで書きましたが,同じデータを周期(秒)で表現するか,その逆数である周波数(Hz)で表現するかによってCV値は異なります。
ほんとですね!!単位換算というとx⇒axしか頭にありませんでした。
勉強になりました。

     [このページのトップへ]


6389. Re^4: 再現性と変動係数について 青木繁伸  2005/04/05 (火) 21:25
そうでしたね。
変動係数は,比尺度についてのみ算出される統計量でした。
ページに書いてありながら,あまりにも使わないものなので,すっかり脳味噌の底に沈んでしまっていました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 033 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る