V1 V2 V3 V4 V5 V6 V7 V8 V9質問(1)「クラスターに含まれる個体数の傾向は群間で異なるか」検定を行いたいのですが,
A群 6 6 4 3 4 9 3 8 6
B群 2 1 8 4 0 1 1 2 3
C群 9 2 1 1 1 0 0 4 1
D群 8 2 3 2 0 3 4 2 3
E群 1 0 1 0 1 0 0 0 0
F群 3 3 4 9 6 4 4 7 10
No.22740 Re: クラスタリングされた個体の割合の比較とライアンの方法について 【青木繁伸】 2019/06/10(Mon) 09:47
ライアン法は,あなたのデータには使えません(使用例参照)
全ての2群の組み合わせ(A:B, A:C, ..., E:F の15組〕について 2 x 9 の行列で chisq.test を行い,p 値をBonferroni法で解釈する(0.05/15)
手作業でやるのは大変なので,以下のようにすればよいx = matrix(c(結果は以下のようになる
6, 6, 4, 3, 4, 9, 3, 8, 6,
2, 1, 8, 4, 0, 1, 1, 2, 3,
9, 2, 1, 1, 1, 0, 0, 4, 1,
8, 2, 3, 2, 0, 3, 4, 2, 3,
1, 0, 1, 0, 1, 0, 0, 0, 0,
3, 3, 4, 9, 6, 4, 4, 7, 10),
nrow = 6, byrow=TRUE)
g = function(ij) {
i = ij[1]
j = ij[2]
y= rbind(x[i,], x[j,])
z = colSums(y)
y2 = y[, z != 0]
p = chisq.test(y2)$p.value
cat(i, j, p, "\n")
return(c(i, j, p))
}
gn = nrow(x)
cn = ncol(x)
p0 = 0.05 / choose(gn, 2)
res = data.frame(t(combn(6, 2, g)))
colnames(res) = c("i", "j", "p.value")
res$sig = ifelse(res$p.value > p0, "n.s.", "*")
print(res)i j p.value sig
1 1 2 0.060309971 n.s.
2 1 3 0.095874639 n.s.
3 1 4 0.365146072 n.s.
4 1 5 0.558144611 n.s.
5 1 6 0.384082770 n.s.
6 2 3 0.034933166 n.s.
7 2 4 0.234596686 n.s.
8 2 5 0.246627056 n.s.
9 2 6 0.177712096 n.s.
10 3 4 0.267205617 n.s.
11 3 5 0.438290867 n.s.
12 3 6 0.005751997 n.s.
13 4 5 0.160816574 n.s.
14 4 6 0.077873765 n.s.
15 5 6 0.441102843 n.s.
No.22741 Re: クラスタリングされた個体の割合の比較とライアンの方法について 【PV】 2019/06/10(Mon) 12:05
青木先生,
早速のご解答,ご丁寧な解説を頂き誠にありがとうございました。
Rで回して無事回答を得られることができました。
引き続き質問となり大変恐縮ですが,ライアン法について
もう少しお伺いさせていただいてもよろしいでしょうか?
今回私のデータではライアン法は適していないとのことでしたが,
私のデータは,郡ごとに各クラスターにあてはめられた個体数の頻度をみており,
青木先生のライアン法およびチューキー法の説明にある
「いくつかの群の比率に全体として差が見られたときに,どの群間に差があるかを検定する手法。(比率の差の多重比較(対比較))」
にあてはまると(素人的に)思ってしまったのですが
私の解析は「比率の差」を見ているわけではないということでしょうか?
また,私のデータは以下のホームページにある例題(ここから青木先生のHPを知りました)
猫も杓子も構造化
http://nekomosyakushimo.hatenablog.com/entry/2017/08/26/222728
のカテゴリー数を増やしただけだと思ったのですが,この解釈は間違っているということでしょうか?
統計解析が素人のため愚問で大変恐縮です。
今後解析を行う上でぜひ参考にさせていただきたいためご解答いただけましたら幸いです。
どうぞよろしくお願いいたします。
No.22742 Re: クラスタリングされた個体の割合の比較とライアンの方法について 【青木繁伸】 2019/06/10(Mon) 12:15
ライアン法,チューキー法は,群(グループ)の数を k としたとき,k x 2 の行列データを対象にするのです。例えば,正否とか失敗・成功のような2値データが対象です。一方(もう一方)の「比率」が対象になります。
一般的に k x m 行列は,群により「分布が違うか」を対象にすることになります。
「カテゴリー数を増やしただけ」ではありません。
No.22743 Re: クラスタリングされた個体の割合の比較とライアンの方法について 【PV】 2019/06/10(Mon) 18:42
青木先生,
なるほど,大変勉強になりました。
お忙しいところ大変丁寧にご説明頂き誠にありがとうございました。
● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る