★ 全くの総計素人です。基礎から教えてください。 ★

 259 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/04 (木) 06:22
  261 Re: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/04 (木) 22:30
   262 Re^2: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/06 (土) 05:53
    266 Re^3: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/06 (土) 23:23
     267 Re^4: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/07 (日) 01:22
      268 Re^5: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/07 (日) 02:03
       270 Re^6: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/07 (日) 22:04
        272 Re^7: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/07 (日) 23:43
         275 Re^8: 全くの総計素人です。基礎から教えてください。  よく見てます  2000/05/08 (月) 05:02
          309 Re^9: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/17 (水) 08:06
          276 Re^9: 全くの総計素人です。基礎から教えてください。  青木繁伸  2000/05/08 (月) 11:25
           279 Re^10: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 17:32
            280 Re^11: 全くの総計素人です。基礎から教えてください。  青木繁伸  2000/05/08 (月) 18:33
             283 Re^12: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 20:07
           277 Re^10: 全くの総計素人です。基礎から教えてください。  よく見てます  2000/05/08 (月) 14:02
         274 Re^8: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 00:51


259. 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/04 (木) 06:22
全くの統計素人なのですが,自分の研究上統計処理が少しだけ?必要になりそうなので訪れました。
 私は南米考古学を行っているものなのですが,時代ごとの遺物の出土数の変化が,果たして意味を持つ変化なのかどうなのかを知りたくて,カイ二乗分析を行いました。しかしながら母集団は数千単位なのに対し,遺物数は一桁代でほとんどが5以下です。正確確率検定も行いましたが,もっと他にに有効な統計処理方法があれば教えていただけないでしょうか。もちろん基礎からの統計に関する書籍などの情報でもかまいません。よろしくお願いします。

     [このページのトップへ]


261. Re: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/04 (木) 22:30
> 時代ごとの遺物の出土数の変化が,果たして意味を持つ変化なのかどうなのかを知りたくて,カイ二乗分析を行いました。しかしながら母集団は数千単位なのに対し,遺物数は一桁代でほとんどが5以下です。正確確率検定も行いましたが,もっと他にに有効な統計処理方法があれば教えていただけないでしょうか。

時代別×出土の有無のk×2分割表と考えて良いのでしょうか?時代(年)が独立変数,出土割合が従属変数と考えられるなら,傾向検定があるでしょう。その一つは,コクラン・アーミテージの検定でしょう。この検定は,一様性の検定(普通のカイ二乗検定)の結果を,「直線性」と「直線性からの乖離」の二つに分解するものなので,普通のカイ二乗検定よりは有効でしょう。

正確確率検定は,どのような検定であっても行うことはできます(プログラムを書いたりしないといけないこともありますが)。

k×2分割表のカイ二乗検定の正確検定の中で,分割表を生成するところはそのまま用いて,コクラン・アーミテージの検定を行うように書き換えればいいでしょう(無責任モードですが)。

     [このページのトップへ]


262. Re^2: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/06 (土) 05:53
リプライどうもありがとうございます。
とてもうれしくありがたく思っております。

> 時代別×出土の有無のk×2分割表と考えて良いのでしょうか?

そうです。
カイ二乗検定の他に,出土数だけをexcelにいれて標準偏差などを出しましたが,これは意味があるのでしょうか?時期は6時期ありますが,遺物数は1,1,2,3,8,3個です。この中の8個に伸びることが有効なのかどうか統計的に見てみたいんです。しかし,母体数の割にはこれらの数が少ないのです。

> k×2分割表のカイ二乗検定の正確検定の中で,分割表を生成するところはそのまま用いて,コクラン・アーミテージの検定を行うように書き換えればいいでしょう(無責任モードですが)。
プりグラムを書き換えるとはすごいことなんではないでしょうか。何をどのように書き換えるのでしょう?コクラン.アーミテージの検定で,独立変数(外的基準値)とあるのですが,ここには何を入れるのでしょうか?

     [このページのトップへ]


266. Re^3: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/06 (土) 23:23
> カイ二乗検定の他に,出土数だけをexcelにいれて標準偏差などを出しましたが,これは意味があるのでしょうか?

この後出てくる数値 1,1,2,3,8,3 の平均とか標準偏差をですか?
意味がないことはないと思いますが,それで何が言えるかといえば,ほとんどないのでは?

> 時期は6時期ありますが,遺物数は1,1,2,3,8,3個です。
> この中の8個に伸びることが有効なのかどうか統計的に見てみたいんです。
> しかし,母体数の割にはこれらの数が少ないのです。

「伸びる」って,どういう意味ですか?

> プりグラムを書き換えるとはすごいことなんではないでしょうか。何をどのように書き換えるのでしょう?

そうですね,自分でできそうでなければ,なかったことにしてください。

> コクラン.アーミテージの検定で,独立変数(外的基準値)とあるのですが,ここには何を入れるのでしょうか?

あなたのデータの場合,外的基準は「時期」でしょうね。時期といってもある程度長い期間でしょうから,その期間の真ん中を西暦年で入力すればいいと思います。

     [このページのトップへ]


267. Re^4: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/07 (日) 01:22
リプライどうもありがとうございます。

> この後出てくる数値 1,1,2,3,8,3 の平均とか標準偏差をですか?
> 意味がないことはないと思いますが,それで何が言えるかといえば,ほとんどないのでは?

やはりそうですか….

> 「伸びる」って,どういう意味ですか?
 
 この時期のみ他の時期に比べ個数が多いような気がしたのです。
そこで,この8個が他の個数に比べ突出しているのか,それとも誤差内にあるのか調べようと思いました。
 他の遺構などからも,この時期の重要性が見て取れるのですが,これら遺物の数ばかりは,絶対数が少なすぎて統計的に見てみなければ,何もいえないような気がしました。

> あなたのデータの場合,外的基準は「時期」でしょうね。時期といってもある程度長い期間でしょうから,その期間の真ん中を西暦年で入力すればいいと思います。

どうもありがとうございます。

     [このページのトップへ]


268. Re^5: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/07 (日) 02:03
> そこで,この8個が他の個数に比べ突出しているのか,それとも誤差内にあるのか調べようと思いました。

ムギュッ x_x

最初の質問で
> 時代ごとの遺物の出土数の変化が, 果たして意味を持つ変化なのかどうなのかを知りたくて
って書いてありましたよね。だから「コクラン・アーミテージの検定」を引っぱり出したのですが,
> この時期のみ他の時期に比べ個数が多いような気がした
のを検定しようとするなら,コクラン・アーミテージの検定は不適切です。
後でいわれたような,比率(割合)が不均一であることを検定するには,カイ二乗検定しかないかもしれません。
しかし,分母がどれくらいか(数千?)わからないですが,もし全部2000だとすると,
http://aoki2.si.gunma-u.ac.jp/exact/fisher/getpar.html
では,すぐに答えが出ますね。(これで,分子が大きいと,計算時間がかかりすぎてタイムアウトになると思う)

# 質問の場合には,背景や条件なるべく具体的にお願いします。
# 数値があると,よりはっきりすると思います。
# 機密を要するデータの場合は,実際の数値でなくて似たような架空の数値でもいいですから。

     [このページのトップへ]


270. Re^6: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/07 (日) 22:04
> ムギュッ x_x
> この時期のみ他の時期に比べ個数が多いような気がしたのを検定しようとするなら,コクラン・アーミテージの検定は不適切です。
> 後でいわれたような,比率(割合)が不均一であることを検定するには,カイ二乗検定しかないかもしれません。

> # 質問の場合には,背景や条件なるべく具体的にお願いします。
> # 数値があると,よりはっきりすると思います。
> # 機密を要するデータの場合は,実際の数値でなくて似たような架空の数値でもいいですから。

大変申し訳ありませんでした。
本当にすみませんでした。かなり大雑把な表現だったものでご迷惑をおかけしました。

具体的な数値を以下に書きます。
1個/7933個 A期
1個/4955個 B期
2個/3423個 C期
3個/4953個 D期
8個/4801個 E期
3個/7122個 F期
となります。この他にも土砂の堆積に対する遺物の個数とかもあるのですが,これも統計処理できるのでしょうか?
11.9立法メートル中1個とか,5.6立方メートル中1個とかです。
もし方法があれば教えていただけますか?もしあるのなら,後日詳しいことを載せます。

     [このページのトップへ]


272. Re^7: 全くの総計素人です。基礎から教えてください。  マンボウ  2000/05/07 (日) 23:43
> 具体的な数値を以下に書きます。

この数値だと,件のページを使って計算すると,カイ二乗分布を使った漸近近似では p = 0.0103722,Exact test では p = 0.00992154 となり,いずれも出土時期と出土率には有意な関連が認められます。

> この他にも土砂の堆積に対する遺物の個数とかもあるのですが,これも統計処理できるのでしょうか?
> 11.9立法メートル中1個とか,5.6立方メートル中1個とかです。

こちらの方は,私にはわかりません。

     [このページのトップへ]


275. Re^8: 全くの総計素人です。基礎から教えてください。  よく見てます  2000/05/08 (月) 05:02
> > 具体的な数値を以下に書きます。
>
> この数値だと,件のページを使って計算すると,

http://aoki2.si.gunma-u.ac.jp/exact/fisher/getpar.html
ですね。

> カイ二乗分布を使った漸近近似では p = 0.0103722,Exact test では p = 0.00992154 となり,いずれも出土時期と出土率には有意な関連が認められます。

spss 10.0+exact test でチェックを入れてみました。
------------------------------------------------
カイ2乗検定
              値  自由度 漸近有意確率 (両側) 正確有意確率 (両側)    正確有意確率 (片側)    点有意確率
Pearson のカイ2乗    14.998     5   .010         .010
Fisher の直接法      11.633                   .018
-------------------------------------------------
Pearsonのχ2値はおそらく一致しているのですが,Fisher の直接法が違っているのです。
まさか青木さんが自分で指摘していた両側と片側を一緒にしているとも思えないのですが,どういうことでしょう。

一応チェックしてもらえませんか?

     [このページのトップへ]


309. Re^9: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/17 (水) 08:06
> spss 10.0+exact test でチェックを入れてみました。
「よく見てます」さん,このデータをそのまま利用してもよろしいでしょうか?
よろしくお願いします。

     [このページのトップへ]


276. Re^9: 全くの総計素人です。基礎から教えてください。  青木繁伸  2000/05/08 (月) 11:25
> Pearsonのχ2値はおそらく一致しているのですが,Fisher の直接法が違っているのです。
> まさか青木さんが自分で指摘していた両側と片側を一緒にしているとも思えないのですが,どういうことでしょう。
>
> 一応チェックしてもらえませんか?

ページの作者からお答えいたします。

私のページのは SPSS における Pearson のカイ二乗法にあたるのだと思います。つまり,カイ二乗統計量に基づいて観察値より極端な分割表の生起確率の和を P 値としています。 SPSS での Fisher 法は,生起確率を小さい順にならべ,観察された分割表の生起確率より小さいものの和が P 値とされているのだと思います。

C. R. Mehta and N. R. Patel(1997)
Exact Inference for Categorical Data.
の8ページ目に説明があります。
http://www.cytel.com/papers/papers.html からダウンロードできます。

私の所で SPSS を試せないので,どなたか試してもらえませんでしょうか。 と,他力本願モード。

     [このページのトップへ]


279. Re^10: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 17:32
> > Pearsonのχ2値はおそらく一致しているのですが,Fisher の直接法が違っているのです。

> > 一応チェックしてもらえませんか?
>
> ページの作者からお答えいたします。
>
> 私のページのは SPSS における Pearson のカイ二乗法にあたるのだと思います。つまり,カイ二乗統計量に基づいて観察値より極端な分割表の生起確率の和を P 値としています。 SPSS での Fisher 法は,生起確率を小さい順にならべ,観察された分割表の生起確率より小さいものの和が P 値とされているのだと思います。
>

 直々のコメントまでいただいて,ありがとうございます。ただ,よくわかりません。カイ二乗検定結果が異なりますが,どのようにこれらを扱えばよいと言うことなのでしょう?

     [このページのトップへ]


280. Re^11: 全くの総計素人です。基礎から教えてください。  青木繁伸  2000/05/08 (月) 18:33
> カイ二乗検定結果が異なりますが,どのようにこれらを扱えばよいと言うことなのでしょう?

「カイ二乗検定結果が異なりますが」とありますが,
Exact test の正確有意確率(両側)の数値が
Pearson のカイ二乗と書かれているところの 0.010
Fisher の直説法のところが 0.018 で違うということですか?

有意水準5%なら,どの方法によっても,帰無仮説は棄却されます。

P値を表示する必要があるとき,どちらの結果を記載するかということなら,どっちでもいいでしょう(主義による?)私としては Pearson のカイ二乗法の方が説明しやすいですね。

     [このページのトップへ]


283. Re^12: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 20:07
>「カイ二乗検定結果が異なりますが」とありますが,
> Exact test の正確有意確率(両側)の数値が
> Pearson のカイ二乗と書かれているところの 0.010
> Fisher の直説法のところが 0.018 で違うということですか?
そうです。
> 有意水準5%なら,どの方法によっても,帰無仮説は棄却されます。
そうでした。どちらにせよ棄却されますね。

> P値を表示する必要があるとき,どちらの結果を記載するかということなら,どっちでもいいでしょう(主義による?)私としては Pearson のカイ二乗法の方が説明しやすいですね。
 ありがとうございました。統計的に見て傾向がわかると,心強く感じてしまいます。統計は,いろいろな面で利用できるのですね。この結果をその他のデータとかみ合わせて見たいと思います。
本当にありがとうございました。

     [このページのトップへ]


277. Re^10: 全くの総計素人です。基礎から教えてください。  よく見てます  2000/05/08 (月) 14:02
> 私のページのは SPSS における Pearson のカイ二乗法にあたるのだと思います。つまり,カイ二乗統計量に基づいて観察値より極端な分割表の生起確率の和を P 値としています。 SPSS での Fisher 法は,生起確率を小さい順にならべ,観察された分割表の生起確率より小さいものの和が P 値とされているのだと思います。
>
> C. R. Mehta and N. R. Patel(1997)
> Exact Inference for Categorical Data.
> の8ページ目に説明があります。
> http://www.cytel.com/papers/papers.html からダウンロードできます。

なるほど。SPSSの Fisher's Exact Test = Freeman and Halton(1951)ということですね。

SPSSのマニュアルにも書いてありました。見逃してました。

どうもお答えありがとうございした。

ps
上のサイトのpdf ファイルのほうがSPSSのマニュアルよりわかりやすく書いてあります。

参照したのは 7.0のマニュアル(1996)。
なんでだ。

     [このページのトップへ]


274. Re^8: 全くの総計素人です。基礎から教えてください。  中嶋直樹  2000/05/08 (月) 00:51
> この数値だと,件のページを使って計算すると,
> カイ二乗分布を使った漸近近似では p = 0.0103722,Exact test では p = 0.00992154 となり,いずれも出土時期と出土率には有意な関連が認められます。
>
どうもありがとうございました。
やはり関連がありましたか。統計的に見ても,関連あると言えるとなるとすごく
心強いです。
本当にどうもありがとうございました。

> > この他にも土砂の堆積に対する遺物の個数とかもあるのですが,これも統計処理できるのでしょうか?
> > 11.9立法メートル中1個とか,5.6立方メートル中1個とかです。
>
> こちらの方は,私にはわかりません。
一つだけでも傾向が見えたので,こちらはいいです。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 007 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る