★ 著作者の検定方法 ★

3515. 著作者の検定方法 卒論 2004/06/20 (日) 11:09
└3516. Re:著作者の検定方法 ひの 2004/06/20 (日) 11:27
 └3517. Re^2:著作者の検定方法 卒論 2004/06/20 (日) 12:17
  └3518. Re:著作者の検定方法 ひの 2004/06/20 (日) 12:28
   └3519. Re^2:著作者の検定方法 卒論 2004/06/20 (日) 12:38


3515. 著作者の検定方法 卒論  2004/06/20 (日) 11:09
初めまして。検定方法を教えてください。
現在,卒論で「著作者の特徴抽出」というのをやっています。まず始めに一人の著 者の語彙の豊富さを調べるために,3作品について主要10品詞,それぞれの延べ語数[N]に対する異なり語数[V(N)]の比[TR]を,「TR=V (N)/N」で求め,それぞれの作品の総語数の違いに依存しないようにしました。
そこで,作品間の類似性を検定したいのですが,統計学素人なので,どの検定を使っていいかわからないので質問させていただきました。それぞれの値は次のようになっています。
品詞   作品1   作品2   作品3
1   0.389     0.273     0.307 
2   0.172     0.101     0.131 
3   0.004     0.004     0.005 
4   0.006     0.003     0.003 
5   0.049     0.027     0.019 
6   0.288     0.196     0.291 
7   0.016     0.008     0.010 
8   0.010     0.005     0.006 
9   0.286     0.177     0.215 
10   0.028     0.016     0.013 
検定方法とどう使うか詳しく教えてもらえたら幸いです。
どうかよろしくお願いいたします。

     [このページのトップへ]


3516. Re:著作者の検定方法 ひの  2004/06/20 (日) 11:27
>て主要10品詞,それぞれの延べ語数[N]に対する異なり語数[V(N)]の比[TR]を,「TR=V(N)/N」で求め,それぞれの作品の総語数の違いに依存しないようにしました。

 総語数の違いに依存しないようにするにはNで割るだけではだめだと思います。V(N)とNがどういう関係になるのかグラフにプロットして確かめてください。単純な比例関係になるならNで割るだけでよいと思いますが,おそらくそうはならないと思います。

     [このページのトップへ]


3517. Re^2:著作者の検定方法 卒論  2004/06/20 (日) 12:17

>  総語数の違いに依存しないようにするにはNで割るだけではだめだと思います。V(N)とNがどういう関係になるのかグラフにプロットして確かめてください。単純な比例関係になるならNで割るだけでよいと思いますが,おそらくそうはならないと思います。

おっしゃる通りでした。ありがとうございました。ちなみに,元のデータは下記の通りで,TRを計算していました。
品詞 作品1      作品2     作品3
1  840/2159| 1163/4265| 1383/4507
2  390/2264|  543/5382|  504/3844
3    8/1856|  14/3710|   16/3439
4   20/3467|  21/7942|  22/7005
5    11/223|   15/549|   14/748
6 2116/7360| 3171/16217| 4465/15347
7   73/4683|  88/10534|   93/9279
8   33/3203|   40/8541|  39/6235
9 1685/5889| 2471/13948| 2333/10840
10    15/528|  17/1058|   14/1048
このように品詞ごとにかなりばらつきがあります。
今回のように品詞ごとに作品の類似度を検定にはどの検定方法が使えるのか教えていただけないでしょうか?度々申し訳ないです。

     [このページのトップへ]


3518. Re:著作者の検定方法 ひの  2004/06/20 (日) 12:28
まずは計量言語学の本でお調べになったほうがよいでしょう。

     [このページのトップへ]


3519. Re^2:著作者の検定方法 卒論  2004/06/20 (日) 12:38
> まずは計量言語学の本でお調べになったほうがよいでしょう。

わかりました。ありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 029 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る