No.11134 代表値について  【Photosynthesis】 2009/10/27(Tue) 23:07

初めて質問させて頂きます。
食品メーカーに勤める者です。社内で予備的な臨床試験を計画しておりますが,統計に関する知識がまだまだ乏しいため,単純な質問で恐縮ですがご質問させて下さい。

検定を行った際の代表値についてです。

対応のあるt検定では「平均値±SD」,
Mann-Whitney検定では「中央値±四分位点」
で表記するのが検定の性質上,相応しいと理解しております。

では Steel 検定,Seel-Dwass 検定ではどのように表記するのが適切なのでしょうか?
関連する文献を幾つか見ても一貫性がなく,迷っております。平均値でも中央値でもどちらでも構わないのでしょうか?

ご回答頂ければ幸いです。宜しくお願い致します。

No.11139 Re: 代表値について  【青木繁伸】 2009/10/28(Wed) 08:48

> 対応のあるt検定では「平均値±SD」,
> Mann-Whitney検定では「中央値±四分位点」
> で表記する

対応のあるt検定とMann-Whitney検定は,対応するものではないですが,そこはおいておくとして。また,○○±△△という記述も不適切です。四分位点は四分偏差(四分領域)のことでしょう。

> Steel 検定,Seel-Dwass 検定ではどのように表記するのが適切なのでしょうか

要 するに,後に引き続く検定がパラメトリック検定のときは「平均値,標準偏差」,ノンパラメトリック検定のときは「中央値,四分偏差」としたいということで しょうが,記述統計と検定は切り離してもよいし,記述統計で,「平均値,標準偏差,中央値,四分偏差」を全部(その他も)記載してもよいわけですから。ど ちらかにしようという場合には,母分布が正規分布なのかその他の分布なのかというのを重視すべきかもしれませんね。

No.11147 Re: 代表値について  【Photosynthesis】 2009/10/28(Wed) 21:55

ご回答大変ありがとうございます。

>記述統計と検定は切り離してもよい

そうなのですか。。。
それは,Mann-Whitney検定を行ったとしても結果を平均値で示してもよい,と考えてよいでしょうか?
しかし,もし有意差があったとしても無かったとしても,見る側に勘違いを与えてしまうということはないでしょうか?

例えば,Mann-Whitney検定を適用すべき事例で有意差があったとします。
その結果を棒グラフで視覚化させる場合,その棒の高さを平均値で示すか中央値で示すかによって,見る側に「こんなに違いがあるのか」とか「有意差があってもこれだけしか違いがないのか」という風な誤解を生じさせてしまわないでしょうか?

「この検定で得られたp値は,このようなデータ群について検定した結果」という事が伝わらないといけないような気がしています。

おそらくこのような平均値と中央値の乖離は n 数が多ければ解消されるのでしょうが,食品の臨床試験などは1群 n<100であることが殆どで,生体マーカーは個体間のバラつきが大きく平均値か中央値かによって群のイメージが変わることがあります。

伝わり難いかもしれませんが,「Mann-Whitney検定を行ったとしても結果を平均値で示してもよいかどうか」についてお答え頂ければ幸いです。

No.11148 Re: 代表値について  【青木繁伸】 2009/10/28(Wed) 22:45

重箱の隅をつつくようですが,平均値や中央値を棒グラフで示すのは止めた方が良いです。描くなら,点とエラーバーの組み合わせや箱ひげ図。

繰り返しますが,「後に引き続く検定がパラメトリック検定のときは「平均値,標準偏差」,ノンパラメトリック検定のときは「中央値,四分偏差」としたい」でよいでしょう。だれも,特に文句は言わないと思います。
両方示すという選択肢も提示しましたし。
> set.seed(1)
> x <- c(rnorm(20, 5), rnorm(20, 5.3), rnorm(20, 5.6))
> g <- rep(1:3, each=20)
> kruskal.test(x~g)

Kruskal-Wallis rank sum test

data: x by g
Kruskal-Wallis chi-squared = 3.321, df = 2, p-value = 0.1900

> oneway.test(x~g)

One-way analysis of means (not assuming equal variances)

data: x and g
F = 2.346, num df = 2.000, denom df = 37.905, p-value = 0.1095

> boxplot(x~g)
> points(g+0.3, x, cex=0.5)
> points(1:3, Mean, pch=19, col="red")
> Mean <- colMeans(matrix(x, 20))
> Median <- apply(matrix(x, 20), 2, median)
> par(xpd=TRUE)
> text(1:3, 1.6, sprintf("mean=%.2f", Mean))
> text(1:3, 1.2, sprintf("median=%.2f", Median))

箱ひげ図の横に描いたのが実際のデータ。赤い点は平均値。
画像はクリックすると原寸表示。


No.11149 Re: 代表値について  【Photosynthesis】 2009/10/28(Wed) 23:35

早速のご回答ありがとうございます。
またご丁寧な説明感謝いたします。

私は解析ソフトはJMPとExcel統計(SSRI社)というものを使用しています。

自身では箱ひげ図を見ますが,この領域に全く疎い他部署の者などに説明する際は,棒グラフや線グラフなどでないと理解してもらえないというジレンマがあります。
ただ,そこを上手く伝えるのが私の役目なので,努力してみます。

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る