No.22739 クラスタリングされた個体の割合の比較とライアンの方法について  【PV】 2019/06/09(Sun) 19:11

青木先生,

はじめまして,
ご多忙のところ失礼いたします。

クラスタリングされた個体を群間で比較し,割合が有意に異なるかどうか,またどの群間でことなるか,検定を行いたいのですが,なかなか方法が見つからず調べていたところ,青木先生のホームページにたどり付きました。
以下記載いたしました質問 (1), (2) ご教授いただけましたら幸いです。

下の表は対象生物170個体をクラスター解析し,
各群(A〜F)で各クラスター(V1〜V9)に分配された個体数です。
	V1	V2	V3	V4	V5	V6	V7	V8	V9
A群 6 6 4 3 4 9 3 8 6
B群 2 1 8 4 0 1 1 2 3
C群 9 2 1 1 1 0 0 4 1
D群 8 2 3 2 0 3 4 2 3
E群 1 0 1 0 1 0 0 0 0
F群 3 3 4 9 6 4 4 7 10
質問(1)「クラスターに含まれる個体数の傾向は群間で異なるか」検定を行いたいのですが,
その場合,カイ二乗検定→ライアンの方法で多重比較 を行う方法は正しいでしょうか?

また,青木先生の説明およびRコードを基に,カイ二乗検定で全体としての差が認められたことを確認後,ライアン法をひとまず行ってみたのですが,
エラーメッセージ「Error: n > 0 は TRUE ではありません 」と表示され,検定を行うことができませんでした。
質問(2)ライアン法は0が含まれていると行えないのでしょうか?

(1), (2) についてご解答のほどよろしくお願いいたします。

No.22740 Re: クラスタリングされた個体の割合の比較とライアンの方法について  【青木繁伸】 2019/06/10(Mon) 09:47

ライアン法は,あなたのデータには使えません(使用例参照)

全ての2群の組み合わせ(A:B, A:C, ..., E:F の15組〕について 2 x 9 の行列で chisq.test を行い,p 値をBonferroni法で解釈する(0.05/15)

手作業でやるのは大変なので,以下のようにすればよい
x = matrix(c(
6, 6, 4, 3, 4, 9, 3, 8, 6,
2, 1, 8, 4, 0, 1, 1, 2, 3,
9, 2, 1, 1, 1, 0, 0, 4, 1,
8, 2, 3, 2, 0, 3, 4, 2, 3,
1, 0, 1, 0, 1, 0, 0, 0, 0,
3, 3, 4, 9, 6, 4, 4, 7, 10),
nrow = 6, byrow=TRUE)

g = function(ij) {
i = ij[1]
j = ij[2]
y= rbind(x[i,], x[j,])
z = colSums(y)
y2 = y[, z != 0]
p = chisq.test(y2)$p.value
cat(i, j, p, "\n")
return(c(i, j, p))
}

gn = nrow(x)
cn = ncol(x)
p0 = 0.05 / choose(gn, 2)
res = data.frame(t(combn(6, 2, g)))
colnames(res) = c("i", "j", "p.value")
res$sig = ifelse(res$p.value > p0, "n.s.", "*")
print(res)
結果は以下のようになる
   i j     p.value  sig
1 1 2 0.060309971 n.s.
2 1 3 0.095874639 n.s.
3 1 4 0.365146072 n.s.
4 1 5 0.558144611 n.s.
5 1 6 0.384082770 n.s.
6 2 3 0.034933166 n.s.
7 2 4 0.234596686 n.s.
8 2 5 0.246627056 n.s.
9 2 6 0.177712096 n.s.
10 3 4 0.267205617 n.s.
11 3 5 0.438290867 n.s.
12 3 6 0.005751997 n.s.
13 4 5 0.160816574 n.s.
14 4 6 0.077873765 n.s.
15 5 6 0.441102843 n.s.

No.22741 Re: クラスタリングされた個体の割合の比較とライアンの方法について  【PV】 2019/06/10(Mon) 12:05

青木先生,

早速のご解答,ご丁寧な解説を頂き誠にありがとうございました。
Rで回して無事回答を得られることができました。

引き続き質問となり大変恐縮ですが,ライアン法について
もう少しお伺いさせていただいてもよろしいでしょうか?

今回私のデータではライアン法は適していないとのことでしたが,
私のデータは,郡ごとに各クラスターにあてはめられた個体数の頻度をみており,
青木先生のライアン法およびチューキー法の説明にある
「いくつかの群の比率に全体として差が見られたときに,どの群間に差があるかを検定する手法。(比率の差の多重比較(対比較))」
にあてはまると(素人的に)思ってしまったのですが
私の解析は「比率の差」を見ているわけではないということでしょうか?

また,私のデータは以下のホームページにある例題(ここから青木先生のHPを知りました)

猫も杓子も構造化
http://nekomosyakushimo.hatenablog.com/entry/2017/08/26/222728

のカテゴリー数を増やしただけだと思ったのですが,この解釈は間違っているということでしょうか?
統計解析が素人のため愚問で大変恐縮です。

今後解析を行う上でぜひ参考にさせていただきたいためご解答いただけましたら幸いです。
どうぞよろしくお願いいたします。

No.22742 Re: クラスタリングされた個体の割合の比較とライアンの方法について  【青木繁伸】 2019/06/10(Mon) 12:15

ライアン法,チューキー法は,群(グループ)の数を k としたとき,k x 2 の行列データを対象にするのです。例えば,正否とか失敗・成功のような2値データが対象です。一方(もう一方)の「比率」が対象になります。

一般的に k x m 行列は,群により「分布が違うか」を対象にすることになります。

「カテゴリー数を増やしただけ」ではありません。

No.22743 Re: クラスタリングされた個体の割合の比較とライアンの方法について  【PV】 2019/06/10(Mon) 18:42

青木先生,

なるほど,大変勉強になりました。
お忙しいところ大変丁寧にご説明頂き誠にありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る