★ テキストの語彙の違い ★

 58 テキストの語彙の違い  びんた  2002/09/24 (火) 15:54
  59 Re: テキストの語彙の違い      2002/09/24 (火) 16:05
   61 感謝 Re^2: テキストの語彙の違い  びんた  2002/09/24 (火) 20:49


58. テキストの語彙の違い  びんた  2002/09/24 (火) 15:54
初歩的な質問で恐縮です。2つの英語のテキストの語彙の違いを調べています。例えば助動詞 'would' がテキストA(1000語)では30回,テキストB(800語)では40回現れたとして,
    A   B  合計
would 30   40  70
合計  30   40  70
2つの観測値の差が,普通に起こり得る範囲のものか,あるいは意味の有る差なのかを判定するのに,χ2乗検定は使えるのでしょうか? (上の分割表は2×1ですから(行数-1)×(列数-1)は0になり自由度は0になってしまうのでしょうか?)
適切な判定方法があれば教えて頂ければ幸いです。

     [このページのトップへ]


59. Re: テキストの語彙の違い      2002/09/24 (火) 16:05
表の作り方がまずいのです。

頻度に違いがあるのかという問ならば,頻度はどうやって計算するかを冷静に考えればわかると思うのですが。

> 初歩的な質問で恐縮です。2つの英語のテキストの語彙の違いを調べています。例えば助動詞 'would' がテキストA(1000語)では30回,テキストB(800語)では40回現れたとして,

would の割合は A では 3%,B では 5% ですね。
二群の割合の差の検定でもいいし,下のようなクロス集計表の検定でもいいです(同じです)

            A   B   合計
would      30  40   70
would以外   970 760 1730
合計       1000 800 1800

     [このページのトップへ]


61. 感謝 Re^2: テキストの語彙の違い  びんた  2002/09/24 (火) 20:49
ド素人の質問に丁寧に解説してくださって大変有難うございました。深謝。

> would の割合は A では 3%,B では 5% ですね。
> 二群の割合の差の検定でもいいし,下のようなクロス集計表の検定でもいいです(同じです)
>
>             A   B   合計
> would      30  40   70
> would以外   970 760 1730
> 合計       1000 800 1800

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 021 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る