No.22475 Re: Rの'irr'パッケージ(新たなスレッドで) 【青木繁伸】 2017/11/14(Tue) 13:36
marginal probabilities というのは,「周辺確率」ということですが,統計学を知らないと難しいかも知れませんね。
集計表で marginal sum というのは「周辺和」といいますが,一般用語では「合計欄」とか「行和」,「列和」といったほうが分かりやすいのでしょう。
irr の kappa2 の example で扱われている diagnose データセットで例を挙げると> data(diagnoses)この分析例では,rater4 と rater5 を対象としています
> # Unweighted Kappa for categorical data without a logical order
> kappa2(diagnoses[,2:3])
Cohen's Kappa for 2 Raters (Weights: unweighted)
Subjects = 30
Raters = 2
Kappa = 0.631
z = 7.56
p-value = 4.04e-14> head(diagnoses[,c(4, 5)])集計表は table(diagnoses[,c(4, 5)]) で求められますが,簡単に表示すると
rater4 rater5
1 4. Neurosis 4. Neurosis
2 5. Other 5. Other
3 3. Schizophrenia 3. Schizophrenia
4 5. Other 5. Other
5 4. Neurosis 4. Neurosis
6 3. Schizophrenia 3. Schizophrenia> t=table(diagnoses[,c(4, 5)])これに「周辺和」を付加すると,
> colnames(t) = rownames(t) = 1:5
> t
rater5
rater4 1 2 3 4 5
1 1 0 0 0 1
2 0 1 0 0 0
3 0 0 6 0 1
4 0 0 0 12 1
5 0 0 0 0 7> addmargins(t)となります。Sum と書かれた行と列にあるのが「周辺和」です。
rater5
rater4 1 2 3 4 5 Sum
1 1 0 0 0 1 2
2 0 1 0 0 0 1
3 0 0 6 0 1 7
4 0 0 0 12 1 13
5 0 0 0 0 7 7
Sum 1 1 6 12 10 30
「周辺確率」はそれをサンプルサイズ(今の例では 30)で割ったものです> rowSums(t)/30 # rater4 に対する周辺確率そ れぞれの周辺確率は本来は同じ理論的な確率にしたがうものでしょう。N2.cohen.kappa で指定するのは,この「理論的な(周辺)確率」です。本来は得られたデータから決めるものではありませんが,取りあえずは 2 人の評価者の平均を参考にするということもあるでしょうし,このデータセットでは6人の評価者の平均を使うということもあるでしょう。先行研究の結果を使 うこともあるでしょう。
1 2 3 4 5
0.06666667 0.03333333 0.23333333 0.43333333 0.23333333
> colSums(t)/30 # rater5 に対する周辺確率
1 2 3 4 5
0.03333333 0.03333333 0.20000000 0.40000000 0.33333333
No.22481 Re: Rの'irr'パッケージ(新たなスレッドで) 【0669SABON】 2017/11/19(Sun) 10:37
青木先生
ありがとうございます。
返信が遅くなり申し訳ございません。
また周辺確率という新しい言葉を聞いて再度調べ直しています。
先のスレッドを見て,私自身もサンプルサイズなどを検討せず研究を進めていたため反省しています。
研究方法,研究倫理を見直します。
統計方法以前の問題ですね。
ありがとうございました。
またご相談させて頂きます。
● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る