No.11431 データの独立性  【加藤】 2009/12/05(Sat) 09:59

ケンドールの順位相関係数を使って,相関があるかどうかを調べたいと思っています。
横軸には日数,縦軸には売上です。データは,2年分あります。(4月から8月が2セット)
データの独立性を考える場合,1年ずつ解析するのがベストだと思われます。
しかし,サンプル数が少ないため,できれば2年分を合計して解析したいと考えています。
いろいろな論文で「年度による差がなかったので,合計して扱った」などの記述がありますが,どのような基準で差がないとしているのでしょうか。

私の解析の場合でいえば,個々の年でケンドールの順位相関係数で有意な相関がみられたという結果が得られた場合やみられなかった場合(つまり,年度ごとでの結論が一致)には合計してもいいという意味なのでしょうか。
それとも,データの分散などを調べて,それぞれの年を比較した場合に差がなければいいという意味なのでしょうか。

よろしくお願いします。


No.11432 Re: データの独立性  【青木繁伸】 2009/12/05(Sat) 11:34

あなたのデータがどんなものだかよくわからないのですが。
2 年分のデータが 2 セットあるということですが,「サンプル数が少ないため」とありますので,データは日単位ではなく,月単位(あるいは週単位)なんですか?
相関係数を計算するのは時間変数(年度初めを 1 として,連続整数?)と売り上げですか?
売り上げは周期を持っているのではないですか?だとすると,通し番号の時間変数殿相関は意味がないでしょう?
それとも,何種類かの商品の売り上げデータがあって,それぞれの商品の売り上げ間で相関係数を計算したいのですか?

個々の「データの分散などを調べて」も,分散が同じでも,他の変数との相関が違うデータはあります。

> 個々の年でケンドールの順位相関係数で有意な相関がみられたという結果が得られた場合やみられなかった場合(つまり,年度ごとでの結論が一致)には合計してもいいという意味なのでしょうか

個々の年で得た相関係数に差がなければ,二変数の関係においては年度差がないということでしょう。しかし,同時に個々の変数の年度別平均値の差もないという条件が必要です。
つまり,データセット間で,解析しようとしている特性にかんするあらゆる条件が同じと見なせなければ,データセットをマージして分析することはできないということでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る