No.06561 対応のある、なしについて  【Juha】 2008/05/17(Sat) 09:45

測定器AとBがあって,同じ試料をAとBそれぞれで測定した結果を検定する際は独立2標本と考えるのでしょうか?それとも 関連(対応のある)2標本としてその後の処理をするべきなのでしょうか?測定に当たってはAとBの測定器で測ること以外,試料には全く操作は行いません。 t検定を独立,関連で行ってみると独立では有意差を認めず,関連では有意差があると正反対の結果が出てきてしまいました。よろしくお願いします。

No.06562 Re: 対応のある,なしについて  【birei】 2008/05/17(Sat) 10:36

結果の何を検定するのかor知りたいのか?データの傾向はどうだから,どうしたいのか(簡単な測定結果を入れるべきです)?つまりこちらには何をしたいのか伝わって来ません。
これにより検定・その他手法も異なって来ます。
また,誤差が正規分布である保証が無い時はt検定等も効果ありません。

No.06563 Re: 対応のある,なしについて  【Juha】 2008/05/17(Sat) 11:18

申し訳ありません。
 測定対象は人の血糖値で測定器を変更するのにあたり従前機と新規機での値の差がある かどうかを知りたい(測定方法は違いますが同様の値が出るという前提です)のでその検討です。ですから二つの機器で測定した血糖値に有意差が無いというこ とを確認したいわけです。データ数は60件の血液をそれぞれの機械で測定しました。
結果は抜き出しですが以下の様に感じです。

ID,OLD, NEW
1, 91, 90
2, 97, 99
3, 102, 104
4, 86, 91
5, 92, 93
6, 104, 109
7, 83, 87
8, 102, 104
9, 106, 110
10,101, 105
11, 99, 102
12, 97, 99
13, 84, 86
14,102, 104
15,134, 137

実 際にはIDが1から60までの検体にそれぞれOLD(従前機),NEW(新規)での測定値を得ました。それぞれのデータについてF検定を行ったところ有意 差は認められませんでした。これからt検定を行おうとしたのですが質問のような状況になってしまい混乱しております。よろしくお願い致します。

No.06564 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 13:47

同じ検体を測定するのですから,対応のあるt検定です。
なお,No.6562 で,「誤差が正規分布である保証が無い時はt検定等も効果ありません」とありますが,「誤差が正規分布」という表現はよくわかりませんね。誤差ではなくて差か?

No.06565 Re: 対応のある,なしについて  【birei】 2008/05/17(Sat) 14:59

F検定は正規分布の分散の分布の相似的比較をしているだけです。有意差無しでも正規とは別物です。
独立・関連の矛盾する原因を探る必用があると思います(問題と思う程p値が違うのでしょうから)。

採種した血液を2つに分割し(同時性が保証されている=真の値が1個)2つのデータの平均に差があるかどうか?
無対応t検定で上手く行かない理由は被験者の選択・環境・条件に作為性が有る(特定疾患者等居る・食べた直後等の場合)・測定誤差が正規でないからでしょう。問題が多いのでこの方式はパス。
対応のあるt検定ではこの場合真の値が1つなので測定誤差(計器の誤差+測定者の誤差)が唯一誤差の要因になります。
多分その差の誤差分布が正規でないと言う事なわけです(差のデータの分布はどうなってますか?正規ですか?誤差平均は?)。
ここで問題解決の為に何かするとすると…差の正規性確認(正規確率紙にグラフにした方が良いですor正規性検定)。
データが正規で無い場合,
原因は測定者の測定技術の未熟・測定機のクセ(可能性小)が原因だと思います。
測定者の未熟:要因を探り練習してもらうしかありません。
測定機のクセ:1度散布図を書き,回帰直線を引いて離れた所のデータの様子を調べる。

No.06567 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 18:46

> F検定は正規分布の分散の分布の相似的比較をしているだけです。

ここで言う「F検定」は「独立二群の等分散性の検定」ですか。
「相似的比較」というのは,等分散とは違いますね。

> 独立・関連の矛盾する原因を探る必用があると思います(問題と思う程p値が違うのでしょうから)。

計算式も違うし,そもそも自由度からして倍くらい違うことになりますから,P値が違うのは当たり前です。どちらの検定を行うかは,データによって決まることです。

No. 6562 で質問者に原データを要求し,No. 6563 でその要求に応えてくれたのですから,それを分析してコメントするのがよいと思います。
回答によってフォーカスを拡散させてしまうのは不適切であると思います。
> t.test(x$OLD, x$NEW) # ★独立な(対応のない)データとして検定

Welch Two Sample t-test

data: x$OLD and x$NEW
t = -0.5895, df = 27.985, p-value = 0.5602 # ★帰無仮説を採択
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-11.932461 6.599127
sample estimates:
mean of x mean of y
98.66667 101.33333

> t.test(x$OLD, x$NEW, paired=TRUE) # ★対応のあるデータとして検定

Paired t-test

data: x$OLD and x$NEW
t = -6.5011, df = 14, p-value = 1.399e-05 # ★帰無仮説を棄却
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.546432 -1.786901
sample estimates:
mean of the differences
-2.666667
> 無対応t検定で上手く行かない理由は被験者の選択・環境・条件に作為性が有る(特定疾患者等居る・食べた直後等の場合)・測定誤差が正規でないからでしょう。問題が多いのでこの方式はパス。

そういうことではないです。

> 多分その差の誤差分布が正規でないと言う事なわけです(差のデータの分布はどうなってますか?正規ですか?誤差平均は?)。ここで問題解決の為に何かするとすると…差の正規性確認(正規確率紙にグラフにした方が良いですor正規性検定)。

これくらいのデータ数で正規性の検定をしても殆ど無意味です。血糖値ということで,正規分布に近いことから,対応のあるt検定の頑健性に頼ることで問題ないと思います。

> データが正規で無い場合,原因は測定者の測定技術の未熟・測定機のクセ(可能性小)が原因だと思います。

そればかりではないでしょうし,今回はこれが問題ではありません。

> 測定機のクセ:1度散布図を書き,回帰直線を引いて離れた所のデータの様子を調べる。

このアプローチはよいことですね。新しい方法 NEW の方が,1例を除き OLD より高い数値を示していますね。

No.06569 Re: 対応のある,なしについて  【Juha】 2008/05/17(Sat) 19:19

birei様,青木様,ありがとうございます。
青木様
>同じ検体を測定するのですから,対応のあるt検定です。
そ うですよねぇ,私もそうだと信じてやっていたのですが・・・・一般的に人の血液検査データはほぼ正規分布をするという前提のもとt検定をと考えていたので すが,データの集め方などに根本的に誤りが有るのかなぁ?と思ってしまいます。別の検査項目ですが試薬間の比較検討を同様の手順で行ったのですが,その際 は特に問題は発生しなかったのですが,やはり何か勘違いしているんでしょうか?もう一度素データのところから再検証してみたいと思います。

birei様
>独立・関連の矛盾する原因を探る必用があると思います(問題と思う程p値が違うのでしょうから)。
STATISTICAで計算していたのですが独立ではp=0.478,関連ではp=0.000000以下との結果が出てしまいました。Rやほかのソフトでも同様の計算結果でした。相関を見ると新規機種に移行しても全く問題のない値を出しているんですが・・・ 
>採種した血液を2つに分割し(同時性が保証されている=真の値が1個)2つのデータの平均に差があるかどうか?
>無対応t検定で上手く行かない理由は被験者の選択・環境・条件に作為性が有る
今回は事前に値の分からない外来患者の血液をまず通常の装置で測定し,測定後すぐに新規装置で測定し,得られたデータを集めました。この方法が間違っていますかね。

No.06570 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 19:37

参考までにグラフ描画したものをアップ
図をクリックすると,原寸大にて表示
(別スレッドにもあったけど,相関が高けりゃいいってもんじゃないという例)
(右上の方に一つだけ離れたデータがあるなぁ,など,いろいろなことが分かる)


No.06571 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 19:45

> 一般的に人の血液検査データはほぼ正規分布をするという前提のもと

一般的に言えば(^_^;),血液検査データは対数正規分布することが多いと思います(濃度系の測定値)。

> t検定をと考えていたのですが,データの集め方などに根本的に誤りが有るのかなぁ?と思ってしまいます。別の検査項目ですが試薬間の比較検討を同様の手順で行ったのですが,その際は特に問題は発生しなかったのですが

どういう問題が起きたというのでしょうか?
対応のある場合の検定と対応のない場合の検定の結果が大幅に異なったこと?
先にも述べたけど,そもそも,それを比較すること自体が不適切(だって,対応のないt検定は適用できないのだから)。

No.06572 Re: 対応のある,なしについて  【Juha】 2008/05/17(Sat) 19:54

返信を送るのにちょっと時間がかかっている間に投稿データからRでの計算をして頂いてありがとうございます。
やはり,対応のあるなしでの計算結果は同じようになりますね。こちらでもRに60件のデータを入れて確認してみました。
散布図を作成しました,何かお気づきの点が有ればお願いします。


No.06573 Re: 対応のある,なしについて  【Juha】 2008/05/17(Sat) 20:11

青木様
そうですね対数正規分布ですね,失礼しました。
おっしゃるとおり比較すること自体が不適切であることはよく分かります。対応のあるというのはどの時点の物を指すのか?というちょっとした疑問から泥沼に入り込んでしまったのかもしれません。手法の選択を間違えれば結果は違ってきて当然ですよね。

No.06574 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 20:20

> 散布図を作成しました,何かお気づきの点が有ればお願いします。

相関図ではなくて,NO.6570 の左のような図を描いてみましょう。

No.06575 Re: 対応のある,なしについて  【青木繁伸】 2008/05/17(Sat) 20:24

この図の赤い線は,回帰直線ではなく原点を通る傾き1の直線です。
この図から得られる情報は,No.6570の左の図と同じですが,わかりやすさは異なるかも知れませんね。


No.06577 Re: 対応のある,なしについて  【birei】 2008/05/18(Sun) 00:55

青木先生 様々御指摘ありがとうございます。
粗雑な回答があった事は認めます。質問者の方ゴメンナサイネ_(._.)_。
で流れに関する質問をさせて下さい。
対応のあるt検定ではこの場合真の値が1つなので測定誤差(計器の誤差+測定者の誤差)が唯一誤差の要因。この様な個体差の要因を初期段階で除くか否かの対応・非対応の問題が1点ある事はありますが,

>> データが正規で無い場合,原因は測定者の測定技術の未熟・測定機のクセ(可能性小)が原因だと思います。
>そればかりではないでしょうし,今回はこれが問題ではありません。

私は一番の問題点は,対応あるt検定で有意差が出てしまった事にどう対応するかだと思っています。有意差が無ければ「どちらも正しい値だっただろう」で特段問題が有りませんが,何故有意差が出るデータになってしまったかに関しては,「測定機の誤差」で済んだのでしょうか?
私の認識ではこの手の測定器はABとも「専門メーカーの検査(+所轄官庁の検査)」が通った物と考えています。「有意差がある」と言う現象は多少不思議な結論です(全体的なバイアスで60件分でそうなったのかもしれませんが)。
OLDとNEWでの計器の測定誤差分(測定器のスペックシートより)の領域を各データに振らせて合理的な説明が付くなら特段問題は有りませんが,数%の誤差はどうも大き過ぎる感じがします。
私が実測者だった場合,今までのOLD/NEWの測定値は何だったのか?と一瞬考えますがこの辺はこの質問で問題にならないのでしょうか?

No.06578 Re: 対応のある,なしについて  【青木繁伸】 2008/05/18(Sun) 21:30

データ解析の元にあるものについては,一対一での詳細な詰めが必要です。ここでの質問にそこまで求めるつもりもありませんし,その後はちゃんとやってねという暗黙の了解もあるかとは思います。

よりよい方向の示唆とか,明らかな誤りの指摘しか行えないのではないかと思います。
質問において,詳細な背景などが示されていないのはやむを得ないというか普通かと思います。ベストな解法を求めたいということを否定するものではないですが,場合によってはそれがかえってわかりにくい方向を示すことになるとすればそれはどうかなと。

No.06579 Re: 対応のある,なしについて  【Juha】 2008/05/18(Sun) 22:40

青木様,birei様,いろいろご指摘くださってありがとうございます。
確かにbirei様の言うように 対応のあるt検定でなぜ有意差が出てしまったのかということが根本的な問題ではあります。ただお二方の書き込みを読んでいてその根本的な問題を自分自身も 脇に追いやっていたというか,その点を改めて書き込んでいいのだろうかと引いてしまっていたと反省しております。申し訳ありません。

測定 器自体はすでに市場に出回っているものですので機械としてのデータ互換性はとれているのですが,自施設において機種変更となった場合,明日から変えるから では周囲に対して説得力が無いので自施設としての互換性検証を行うのですから,それが意図しない結果になったというのはやはりデータの収集段階からの検証 をやり直してみる必要があると思います。測定値の分布の設定も一考してみます。

青木様,>NO.6570 の左のような図
この図は今まで考えもしませんでした。エクセルでデータの差を記載することはしますがそれを図に表すことまでは考えませんでした,差を表記するよりデータの関係がわかりやすいですね,次回からの参考にさせていただきます。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る