No.01090 過去の結果群と今回の結果の比較  【ほり】 2006/09/14(Thu) 22:22

はじめて投稿させて頂きます。統計初心者です。よろしくお願いします。
100地点程度について,今年の他,過去5 年間の水質データがあります。各地点について,今年の結果が過去5年間の結果群と比較して上昇したか低下したか定義したいと考えています。過去の全水質 データ(約500個)の分布を見ると全く正規分布せず,常用対数として分布を見ると一応中央に山があり正規分布に少し近くなるような状況です。ただし, SPSSで正規分布検定(コルモゴロフ・スミルノフ検定)というのをすると対数としても棄却されてしまいます。
環境データは対数正規分布すること が多いと聞くことと,上記のような状況からとりあえず各地点について過去(3〜5個,地点によって調査回数が異なる)のデータの幾何平均と今回の結果を比 較して上昇か低下かを定義してみています。ですが,「検定ではいずれも正規分布は棄却されるが,なんとなく対数を取ると正規分布に近い気がするから過去の データを幾何平均した」という理由では学会で発表するときなど困ってしまいます。
どういった方法で過去の結果の平均値を定義して今年の結果の上昇,低下を判断するのが妥当かと,それを妥当とする理由をご教授頂けますでしょうか。
なお,何のために上昇,低下の定義をしたいかというと上昇した地点群と低下した地点群の社会的指標(人口,畑面積,家畜頭数など)にどんな差があるか検定するためです。

No.01091 Re: 過去の結果群と今回の結果の比較  【青木繁伸】 2006/09/14(Thu) 22:29

中央値で比較するというノンパラメトリック的アプローチではだめなんですか?

地点ごとに複数の測定があるとか,ちょっといやらしいデータのように思います

No.01092 Re: 過去の結果群と今回の結果の比較  【ほり】 2006/09/15(Fri) 05:49

早速のご回答まことにありがとうございます。
実はこのデータは毎年大きなぶれがあるデータです。例えば, 3年分のデータある地点では「0.5,15,2」などです。もっとある程度落ち着いたデータであったり測定回数が多ければ中央値でいいと思いますが,もっ といい方法がないものかと思っていました。「統計学的には分布が正規分布していない以上,過去の結果の代表値は中央値で考えるしかない。」ということでよ ろしいでしょうか。

No.01093 Re: 過去の結果群と今回の結果の比較  【青木繁伸】 2006/09/15(Fri) 08:22

> もっとある程度落ち着いたデータであったり測定回数が多ければ中央値でいいと思いますが

落ち着いたデータでないからこそ中央値でやる方が良いのでは?
測定回数が少ないのは,平均値でやる理由にも中央値でやる理由にもならないのでは?

No.01094 Re: 過去の結果群と今回の結果の比較  【ほり】 2006/09/15(Fri) 08:42

回答ありがとうございます。

中央値で検討してみたいと思います。

>測定回数が少ないのは,平均値でやる理由にも中央値でやる理由にもならないのでは?

そのとおりと思います。変なことを記入してしまいすみませんでした。

ありがとうございました。

No.01127 Re: 過去の結果群と今回の結果の比較  【夏維】 2006/09/20(Wed) 08:54

お疲れさまです.

一つだけ気になった点

>過去の全水質データ(約500個)の分 布を見ると全く正規分布せず,常用対数として分布を見ると一応中央に山があり正規分布に少し近くなるような状況です。ただし,SPSSで正規分布検定(コ ルモゴロフ・スミルノフ検定)というのをすると対数としても棄却されてしまいます。

検定はn数が多いと棄却されやすくなります.分布の検定も同じで,n数が多いとわずかな差を差有りとして判定してしまうので,n数が多い場合には,分布の形状をヒストグラムで確認するなどして判断した方がよいと思います.

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る