No.08216 データ水準について  【いも】 2008/11/10(Mon) 17:04

比例尺度の例として試験の点数も含んでもかまわないと聞いたことがあります.
0-100点の範囲で1点ずつの分解能である場合はある程度の分解能があるのでそれでもいいのかな?とも思いました.しかし,この点数が,
0,1,2,3
というきわめて荒い分解能であった場合でも,あるいは究極的に,
0,1
であった場合でもこれは比例尺度と言っていいのでしょうか?これはすでに順序尺度のような気がします.間隔尺度以上と分類されるか順序尺度であるか,この線引きは分解能という点ではどこで引かれるのでしょうか?
また,間隔尺度以上としても,検定を行う場合,これらはパラメトリックな検定は扱えないように思うのですが,いかがでしょうか?ご教授ください.

No.08217 Re: データ水準について  【青木繁伸】 2008/11/10(Mon) 17:40

比尺度の定義を考えればおわかりと思います。
比尺度の変数は0という観察値を持ってはなりません(絶対温度とか体重が0というのはありえません)。
従って,0点があり得る試験の成績は比尺度ではありません。
得 点間の間隔が等間隔なら,間隔尺度でしょう。0-100点の場合はまあ,近似的に等間隔と見なしてもよいかも知れません(厳密に言えば等間隔にはなってい ないでしょうね)。ということなら,順序尺度にすぎないでしょう。5段階評価というときに,等間隔を保証することはほとんどできないでしょう。分解能とい うより,中心極限定理の影響と行った方がよいかな。
ただ,0/1のように二値しか持たないデータは,これは順序尺度であって,かつ間隔尺度です (なお,性別やある特性の有り無し等というのは名義尺度でもあるけど,2つのラベルには何らかの順序づけが可能なので,0/1データは名義尺度であり,順 序尺度であり,かつ間隔尺度であるということになる)。というのも,データ間の間隔が1個しかないので,「データの間隔が等しい」ということがナンセンス (一つしかないものが何と等しいというのかということ)。重回帰分析でダミー変数(0/1の二値変数)を使うことが正当なのはこの理由から(当然,このダ ミー変数について他の変数との分散共分散行列を使うことになる)。また,二値データを取る2つの変数のφ係数は,二値データに適当な数値を割り当てて(ま あ,0/1でよいわけですが)計算したピアソンの積率相関係数と同じです。つまり,積率相関係数を計算すると言うことは,平均値も分散(標準偏差)も求め ているということです。そして,それは正しいことなのです。なお,0/1データの平均値は比率(割合)ですよね。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る