No.15506 分布の比較について  【tau】 2011/10/16(Sun) 19:13

下記の点について,ご教示頂けませんでしょうか?

ある疾患Aが発生する時間帯について調査し,約3年間分のデータがあります。
0時から24時まで,1時間毎に発生件数をプロットすると,日内変動の様子が分かります。
この分布(=日内変動)に,年度ごとの差があるかどうかを検定する方法はありますでしょうか?ご教示頂ければ幸いです。
(コルモゴロフ・スミルノフ検定なども考えましたが,年度ごとの発生件数に差があるため,ピークの値に差が出てしまい,この検定で純粋に分布を比較するのは難しいのではないかと考えました。)

No.15507 Re: 分布の比較について  【青木繁伸】 2011/10/16(Sun) 21:44

> 年度ごとの発生件数に差があるため,ピークの値に差が出てしまい

ということが問題ではなく,データ記述上,23:59:99 の次が 0:00:00 なのが重大問題でしょう。それをどうやってデータ化するか。

No.15510 Re: 分布の比較について  【tau】 2011/10/17(Mon) 09:21

返信頂きまして誠にありがとうございます。

>ということが問題ではなく,データ記述上,23:59:99 の次が 0:00:00 なのが重大問題でしょう。それをどうやってデータ化するか。

時間の区切り方(=一時間毎)が問題と言う事でしょうか?
時間の区切り方に関しては,色々試すつもりでいるのですが,,,。
0時をまたいだ時間(例えば,23時から2時)を一つのグループとして,以後3時間毎に区切っていくという区分も考えています。

方向違いの回答でしたらご容赦ください。

No.15512 Re: 分布の比較について  【青木繁伸】 2011/10/17(Mon) 14:18

> 0時をまたいだ時間(例えば,23時から2時)を一つのグループとして,以後3時間毎に区切っていくという区分も考えています。

どのように区切ろうと,上の例だと,23~2 は,前日の 20~22 に続くのか,当日の 3~5 の前にあるのかで違うでしょう。

ま あ,データは違うけど,風向きのデータの分析について,時計回りに,北から初めて北北西で終わるのと,北北東から初めて北で終わるのは,例えば1〜16の 数値を割り当てるとすると,最初の割り当てでは北は1になり,後者の割り当てでは 16 になるということ。例えば,北と北東の差をとってみると大違いになる(つまり,循環データは普通には扱えない)ということです。これではコルモゴロフ・ス ミルノフ検定検定にしろ何にしろ使えない。

No.15513 Re: 分布の比較について  【tau】 2011/10/17(Mon) 18:26

青木先生

返信ありがとうございます。

循環データに関しては,分布の違いについての検定ができないという理解でよろしいのでしょうか?日内変動が年度ごとに異なるか否かを調べたいのですが,各年度毎,開始の区分を統一すれば比較できるのかと考えたのですが,,,。
(グラフを添付したいのですが,うまくアップロードできませんでした。申し訳ございません。)

No.15514 Re: 分布の比較について  【青木繁伸】 2011/10/17(Mon) 19:10

パターンの類似性は,どこで区切ってもできますよ。

グラフのアップについては,上の「利用上の注意」の所に描いてあります。読みましたか?

PNG 以外は受け付けません。

> 画像などのバイナリーファイルをアップロードすることが可能です。

> 添付可能ファイル : PNG
> 最大投稿データ量 : 150 KB
> 画像は横400ピクセル,縦400ピクセルを超えると縮小表示されます。

No.15515 Re: 分布の比較について  【tau】 2011/10/17(Mon) 20:36

返信,誠にありがとうございます。

利用上の注意まで見ておりませんでした。申し訳ございません。
添付のファイルのようなデータになります。見にくくて,申し訳ございませんが,このパターンが同一か否かを調べたいと考えております。どのような手法があるのか,ご教示頂けませんでしょうか?

使用可能な統計ソフトは,JMPあるいはRになります。


No.15516 Re: 分布の比較について  【青木繁伸】 2011/10/17(Mon) 21:00

パターンが同じかどうかということなら,相関係数を見る。
同時に,レベルがどうじかということなら,平均値なり,中央値を見る。
両者に有意の差があると言うことが否定されれば,まあ,似ているかなということ。
なお,通常の「差があるかどうかの検定」ではなく「同等性の検定」を参照のこと。

図と共にですが,数値をそのまま提示してくれれば,追試も容易になると思います。

> 年度ごとの発生件数に差があるため,ピークの値に差が出てしまい

というのはよく分かりませんね。

でも,基本的なことですが,データは母集団のデータなので,そもそも検定という手段は適用できない。(検定というのは,標本データから母集団について言及すること)

No.15518 Re: 分布の比較について  【tau】 2011/10/18(Tue) 08:41

青木先生

色々とご教示頂きまして誠にありがとうございました。
同等性の検定についても調べてみます。
また,次回からは図と数値共に提示したいと思います。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る