No.06524 相関係数について。  【田中正義】 2008/05/10(Sat) 11:08

相関係数についてお尋ねいたします。
二つの測定機で計測したデータから,これらの測定機に相関があるかを,調べています。
データは二つの測定機にて寸法測定を行ったものですが,データを取った順番で相関係数を求めると0.29ですが,データを昇順に並べ替えると0.78になります。
この場合の相関係数を算出する場合,採取したデータの順番で相関係数を出さないと意味をなさないのでしょうか?
それとも,データを並べ替えて計算してもよろしいものなのでしょうか?

No.06525 Re: 相関係数について。  【田中正義】 2008/05/10(Sat) 11:25

今,他のサンプルを昇順にして計算したところ,測定データの値が違っていても昇順にすると相関係数は良い値に変わってしまうことが分りました。
それで,また質問なのですがそもそも,測定データを並べて相関係数をだして,この二つの測定機の相関を判断してよろしいのでしょうか?

No.06526 Re: 相関係数について。  【青木繁伸】 2008/05/10(Sat) 14:50

同じものを2つの方法で測定して,その結果を比較してこそ意味があるわけでしょう。
昇順に並べ替えて相関を求めると,組にされた測定値が同じものを測った結果であるということが失われますよね。昇順に並べて「順位相関係数」というものを計算すると,殆ど1になりますよ。つまり,完全な相関ということですが,おかしいのはあきらかでしょう?
> x <- sort(rnorm(20)) # 乱数を20個,昇順に並べ替え
> y <- sort(rnorm(20)) # 乱数を20個,昇順に並べ替え
> cor(x, y, method="spearman") # スピアマンの順位相関係数を計算
[1] 1 # 完全な相関があるということ
> cor(x, y, method="pearson") # 普通の相関係数(ピアソンの積率相関係数)を計算
[1] 0.9814405 # きわめて1に近い ← この結果は間違い
> データを取った順番で

というのも変だ,というのはもうおわかりと思います(組を作っているデータが,必然的な対応じゃないということです)。

ある条件のもとで2つの方法で測定,別の条件の下で2つの方法で測定,…… というように測定し,結果は,以下のように整理されるでしょう。行あたり2つの測定値が組を作るのです。この組はくずしてはなりません。この2つの数値の組を元にして相関係数が計算されるのです。

   方法1 方法2
条件1 ○○ ○○
条件2 ○○ ○○
 :
条件n ○○ ○○

No.06527 Re: 相関係数について。  【田中正義】 2008/05/10(Sat) 21:09

お手数をお掛けしまして,申し訳ございませでした。さて測定の順番を変更したり,採取したデータ順に相関をとる事 が間違いであることは,理解できたのですが,ご回答にあります条件なのですが,自分で考えなければいけない事だとは思いますが,ただ寸法を測定する測定機 に条件とはどのような事なのかわかりません。例えば方法は三角定規と,ものさしで寸法測定をするとした場合,どんな条件をつければよろしいのでしょうか? それとも,統計学的な条件があるのでしょうか?今回は単純に同じサンプルを,二つの測定機でn=10のデータをとりました。でもこれでは必然的な対応では なく,以降の作業が行き詰りました。ご教授のほどよろしくお願いいたします。

No.06528 Re: 相関係数について。  【青木繁伸】 2008/05/10(Sat) 22:22

条件とは,詳細なものから簡単なものまで,何段階も考えられるでしょう。

> 今回は単純に同じサンプルを,二つの測定機でn=10のデータ

ということでも,本当に同じサンプルを10回ずつ測ったのなら,測定の組を作るのも任意でよいじゃないか最初から1〜10番目という順の組を作ったらよいじゃないかということかもしれませんね。だったら,少なくとも,「昇順に並べ替える」などということはしないことです。

「同じサンプルを何回も測る」というのは,測定誤差について再現性を見ているようなものです。たとえそのような測定実験をしたとしても,2つの測定器の測定値の相関係数は0に近くなるのではないでしょうか?

測 定値が違ってくるような条件(実際にはそれが何かは,書かれていることからはわかりませんが)を変えて,例えば血圧を測る測定器のような場合,血圧のこと なる様々な人について2通りの方法で測定してその測定値の異同(類似性)を見るものでしょう(つまり,ある程度の変域を持つ測定値を同時に2種の測定器で 測定し,その測定値がほぼ同じ値を示すかを見るべきものなのではないですか?)。同じ人の血圧を測るにしても,測定時を変えて(つまり,その人が示す色々 な血圧を)測定して比較するのが妥当ではないですか。ある一人の人の血圧を10秒ごとに10回測って,引き続いて別の測定器で同じく10回測って,その測 定値の異同を見てもあんまり意味がない。

2つの測定器で測ったものが同じかどうか,それを判定するにはどのようなものをどのように測定して値を比較したらよいか,もう一度考えてみることが必要だと思いますよ。

参考になるかどうかわかりませんが,別の例をあげてみましょうか?

医者Aと医者Bが同じ程度の診断能力があるかどうか判定するとき,あなたならどうしますか?

同じ患者を一日のうちに10回ずつ診断させてその結果(一致状況)を判定する
10人の患者を診断させてその結果(一致状況)を判定する
10人の患者の5ヶ月ごとの状況を(5回ずつ)診断させてその結果(一致状況)を判定する

No.06531 Re: 相関係数について。  【田中正義】 2008/05/11(Sun) 00:32

早々のご回答をありがとうございます。今回の目的は三次元測定機のデータが,他の測定器(ノギスやマイクロメータ など)との相関を見極めるものでしたが,改めてその奥深さを知ることが出来ました。測定値が違ってくる条件は測定器そのものが,それぞれ三次元測定機,ノ ギス マイクロメータの3種で測定を行います。それに対して測定物を直径1?から50?(10?間隔)で測定します。ただ最後にまだ理解出来ないことなの ですが,青木様の例としてあげられた10人の患者を診断と言う事を,今回私が行おうとしている測定を当てはめると,1?の測定物をn=1では測定誤差もあ ることからn=10またはそれ以上の測定をしようと考えてしまうのですが,青木様が言われた「同じサンプルを何回も測る」というのは,測定誤差について再 現性を見ているようなものです。たとえそのような測定実験をしたとしても,2つの測定器の測定値の相関係数は0に近くなるのではないでしょうか?」との事 から,どのように対処して良いのかが分りません。
もしかしたら,そもそも相関係数で答えを求めようとしていることが間違いなのでしょうか?では他に何で相関の有無をと言われるとそれもまた今現在見当たらない状況です。

No.06532 Re: 相関係数について。  【青木繁伸】 2008/05/11(Sun) 11:43

> n=10またはそれ以上の測定をしようと考えてしまうのですが

同一対象を10回測るのではなく,同じように作られた10個のものを測るようにすればいかがでしょうか。ものすごく制作精度が高ければ同じことになるでしょうが。

No.06537 Re: 相関係数について。  【birei】 2008/05/11(Sun) 21:50

御二人のやり取りと質問の関係がわからないので,教えて下さい。

>三次元測定機のデータが,他の測定器との相関
ノギス・マイクロメーター・三次元測定機の3種の誤差の大小関係を見たいと言う事でしょうか?

1)測定ブツの大きさと,各測定機との相関でしょうか?
1−1)ノギスで 大きさ(1,10,20,30,50)と測った時の[大きさ,ノギス測定誤差]の相関
1−2)マイクロで大きさ(1,10,20,30,50)と測った時の[大きさ,マイクロ測定誤差]の相関
1−3)3次元で 大きさ(1,10,20,30,50)と測った時の[大きさ,3次元測定誤差]の相関
結果:「ブツの大きさ」と測定機ごとの誤差の大小関係がわかる。
例えばマイクロメーターは小さい時は有利だが3次元測定機は大きい時は有利とか
2)そうで無い時,何の目的で何を測りたいか

No.06538 Re: 相関係数について。  【青木繁伸】 2008/05/11(Sun) 22:00

> bieri さん

私は,「同じものを測定するときに,いくつかの測定法で測定した測定値に一致性(相関)が認められるか」という観点でやりとりしていたつもりですけど?
不審な点がありましたか。。。

No.06540 Re: 相関係数について。  【birei】 2008/05/12(Mon) 00:32

質問を改めます。
質問者の方に質問点がわからないのでお聞きしたいです。

結局知りたいのが,何と何の関係か?「誤差と測定機?」「測定値平均と測定機?」
どっちを知りたいかです。
言い替えると最終目的は誤差を知りたいのか平均を知りたいのか?
--------------------------------------------
50mm(絶対的な固定値の単ー品)の物を3度測ったとして,
ノギス: 50.1,50.3,50.4
マイクロ:50.01,50.03,50.04
3次元 :50.2,50.5,50.8
多分こんなデータで意味が無いかと…

誤差で表現すると
ノギス: 0.1,0.3,0.4
マイクロ:0.01,0.03,0.04
3次元 :0.2,0.5,0.8
誤差の平均に違いがあります。
--------------------------------------------
もし1mm(絶対的な固定値の単ー品)の物を3度測ったとして,
ノギス: 1.3,1.5,1.9
マイクロ:1.02,1.03,1.05
3次元 :2.2,2.5,2.3

誤差で表現すると
ノギス: 0.3,0.5,0.9
マイクロ:0.02,0.03,0.05
3次元 :1.2,1.5,1.3
ブツの大きさと誤差の平均に違いがあります。

こう言う事でしょうか?変な質問だったらすいません。読んでてわからなかったもので。

No.06545 Re: 相関係数について。  【takahashi】 2008/05/12(Mon) 12:06

測定法間の相関でしょう。

例えば身長を,私が目分量で測ったときとあなたが目分量で測ったときの相関。
で,質問者の方の目的は存じませんが,同じヒトを10回ずつ,私とあなたが目分量で計ってその相関を出そうとしていたのでよくわかんないことになっている。
10人違うヒトを連れてきて計ればよい,というのが青木先生の提案。直感的にそれが一番手っ取り早いと思います。

No.06556 Re: 相関係数について。  【birei】 2008/05/14(Wed) 00:09

ではお聞きします。
測定器のモデルは,≪測定値=(1+リニアリテイエラー)×測定量+オフセットエラー≫と言うモデルに設計されます。
違う測定器を使う意図や関心事は1:精度・2:測定範囲の2点に絞られます。
例)『同一』の直径(10,20,30,40,50)のブツを測ると測定結果はおおよそ

有効数字3桁ノギス (10.1 ,20.2 ,30.3 ,40.4 ,50.5 )
有効数字4桁マイクロ(10.01 ,20.02 ,30.03 ,40.04 ,50.05 )
有効数字5桁3次元 (10.001,20.002,30.003 ,40.004 ,50.005 )
これで測定器間の何を計算するか?と言う事です。相関係数は0.99位
一般に3桁程度はどちらのエラーも推奨測定では精度があるのでこの相関は測ってどうするのですか?

私なら差となった数字の≪大きさ・測定環境での変動平均・分散≫に興味があります。質問者も同様だと思いました(だから同一ブツを何度も測定した)。
有効数字3桁ノギス (00.1 ,00.2 ,00.3 ,00.4 ,00.5 )
有効数字4桁マイクロ(00.01 ,00.02 ,00.03 ,00.04 ,00.05 )
有効数字5桁3次元 (00.001,00.002,00.003 ,00.004 ,00.005 )
有効桁と加減乗除演算等での誤差増幅を押さえないと別種の質問の様に分散が負になったりします(事情は違う様ですが)。
人は1・2・3と有効数字∞+εと考えられますがそうでない対象は沢山有ります。

No.06557 Re: 相関係数について。  【青木繁伸】 2008/05/14(Wed) 00:50

質問者からの情報がないので,勝手にああでもあろうこうでもあろうと議論してもしようがないと思います。

複数の測定器(測定法)が与える測定値の一致性(再現性)の評価は様々な方法で行わないといけないことは確かで,相関係数だけで判断できるものでないことは明らか。
また,その測定値がどのような範囲の値を取るかも判断の基準とされるべき。
特に,質問者が最初書いたように,
> データは二つの測定機にて寸法測定を行ったものですが,データを取った順番で相関係数を求めると0.29です
という状況は,疑問だらけです(相関が0.3程度の測定法というのは,にわかには信じられない)。
さらに,「測定値を昇順に並べて相関を取ったら相関係数が高くなった」と書かれると,どのように素材を準備して,どのように測定を行ったか(測定順序など)をちゃんと吟味しないと,ちゃんとした手順が取られているかどうか疑わしい。

質問者も,「相関係数だけで評価するのでよいのだろうか」とは言っているが,まず相関係数でもちゃんと評価することができないとね。

そのほかの評価基準について議論するには情報がなさ過ぎる。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る