焦点

でっかいことに焦点を

【リブロジ032】2.6 偏差値について

理系が文系に伝える実践的ロジック。の略で、リブロジ。

なんやかんやで30回を越えてきました。

 

先週で、この2章「データを集め、分解・整理・比較する」で当初予定していた内容は一周しました。

 

ここで、2.4で出てきた偏差値の話をはさんでみようと。

kohei327.hatenablog.com

 

分かってみると簡単で、いかに変な使われ方がしているかに気付ければ何より。笑

道具も使いよう、ですね!

 

これが分かると、他の分布についても見通しがよくなる。

相手のデータの前提のおかしさに気付けるようになる。

これが分からないと、結局本質になかなか届かず遠回りになる。

 

ということで、偏差値についてちょっと説明してみましょう。

一言で言い切ってみると、

「その集団の中で上から何人目かを知ることができる値」

です。

つまり、1000人がそのテストを受けた場合、

 ・偏差値80:1番目

 ・偏差値70:23番目

 ・偏差値60:159番目

 ・偏差値50:500番目

 ・偏差値40:841番目

 ・偏差値30:977番目

 ・偏差値20:999番目

という感じです。

 

なんで偏差値に置き換えるのかというと、

「点数では本当の順位が分からないから」

です。

 

国語と算数のテストをやったとして、

どちらも同じ50点を取っても、

国語の平均が70点、算数の平均が30点だったら、

全体の中でどのあたりにいるか、はぜんぜん異なります。

 

少しアドバンスドで、

国語も算数も60点を取ったとして、

どちらの平均も50点だった場合。

 

平均が50点でも、分布が違ったとする。

つまり、

国語のテストは100点から0点まで万遍なく分布している。

算数は60点から40点の間しか分布がない。

この場合、同じ「60点」でも全体の順位は全く異なりますね。

 

国語は真ん中よりちょっと上。

算数は一番上。

 

こんな風に、点数で比較しようとしても、

「平均値はどこ?」

「ばらつきがどのくらい?」

の二つのファクターを考えにいれないど、

自分が全体の中でどのくらいか、ということは

正確につかめないという課題が生まれます。

 

そこで編み出したのがこの偏差値。

 

最初に書いたように、偏差値の値を見れば、

異なるテスト(教科別、時期別)での自分の立ち位置が

定量的に分かるというメリットがあります。

 

なので、教科毎に自分が弱いのはどれじゃろなー、

前回のテストから自分が伸びたのかどうなのかー

という比較ができます。

 

ここで注意点として、

①   偏差値は、分布が正規分布(ざーっくりいうと左右均等)でないと正しくでない

②   母数が少なすぎると正しくでない(100人くらいで出しても、、、ね)

③   異なる集団で計算した値同士を比較できない

ということが挙げられます。

 

以下詳細に。

①   例えば、点数の分布がふた山になっていると変な値が出てしまう

(70点にいっぱい、50点が少ない、30点にいっぱい、など)。

普通は難しいけど、本来は、全員の点数分布(ヒストグラム)を見てから

偏差値が使えるか判断が必要

②   少ないとノイズが増えてしまう

③   超進学校の偏差値とそうでもないとこの偏差値、

日本全国共通模試の偏差値は、同じ50でも意味が違う。

偏差値=順位を表す数字、だと考えると、少し分かってくれると思います。

 

 

今回はこんなものかな。

次回、もう少しグラフや数式を用いた数学的な説明にトライしてみます。

 

最後に宿題!

①   偏差値って何?

②   今回の説明で分からないことを教えて下さい。

ほな!