【リブロジ034】 補講:エイや、の推測精度を上げるシンプルな方法
理系が文系に伝える実践的ロジック。
の略でリブロジ。
着々と前に進んできています。
前回で2章を一旦終えました。
ちょっとハードだったと思いますがついてきてくれてありがとうございます。
これ以上深めるのはリブロジのアドバンスドでやりましょう
(何でそうなるの?とか)
ということで今回は補講。
読み物ということで。
えっとエイや、の推測の精度を上げるお話。
前回までに偏差値やりましたね。
その中身が使えます。
この方法を知っていると自分で予測するときにも使えるし、
人の予測の検証もできます。
偏差値の前提となった正規分布をイメージしていただいて、、
具体的な例でいきましょう。
何らかの部品の寸法を予測する場合。
ここでは使用中の鉛筆の長さにしましょうか(いまどき無いけど)。
筆箱に使いさしの鉛筆が10本あります。
それぞれ使い込まれて最初の長さからは短くなっている。
使っていない鉛筆の割合が高くない場合、
大量に集めるとだいたい正規分布するでしょう、、、
うーん、使われ方による気もするけれど一旦そう仮定します。
その長さってどのくらい?
って聞かれた場合、普通は「平均値」で答えるかと思います。
◆だいたい15cmくらい
など。
ここで、一つ追加します。
それは「標準偏差」。
偏差値のときに、偏差値が60だと上から何人目、とお伝えしたかと思います。
これは見方を変えると、
・偏差値が40~60の間にだいたい67%
・偏差値が30~70の間にだいたい95%
・偏差値が20~80の間にだいたい99.7%
の人が入るということになっています。
ここでよく出てくる(?)標準偏差σを使います。
偏差値はその計算の中で、標準偏差σが10になっています。
そう、標準偏差はばらつきの度合いを示しています。
上の偏差値の例を偏差値で書き直すと、
・標準偏差が-1σ~1σの間に68.2%
・標準偏差が-2σ~2σの間に95.5%
・標準偏差が-3σ~3σの間に99.7%
の物が入ってくるということになります。
鉛筆の例に戻ると、予測するときに例えば
◆平均15cm、2σが5cmかな
と判断するとします。
そうすると意味することは、
筆箱の中の鉛筆を並べると
・鉛筆の長さが10cm~20cmの中に95.5%
入ってくるということです。
分かるかな?難しいかな、、、。
ここで予測の補正のステップへ。
・鉛筆の長さが10cm~20cmの中に95.5%
はなんとなくおかしい気がする。
というのは、削ってない鉛筆が20cmとして、
捨てる寸前の鉛筆が8cmくらいとすると、
すこし平均値が高いかなーと(思ったとする!)。
これを元に予測を補正するなら、平均値を補正して、
(20+8)/2=14
となり、
◆平均が14cm、2σが5cmかな
となります。
平均値が少し減りましたね。
言いたいのは、正規分布の場合、
【平均値に加え、標準偏差も予測すると、平均値の予測精度が上がりうる】
ということです。
ばらつきもみて判断しよーよ、ということですね。
どんなものでもばらつきはあって、
ばらつきのことを無視してピンポイントの最高を狙いだすと、
片手落ちになります
(効率最高を目指してばらつきまみれのものになっちゃう、とかね)。
当然データを見ることは大事だけど、
データを見るとき、そこから粗く推定する場合、
【平均値と標準偏差】
の両方を推測して、それがどのような関係になっているか。
これは自転車の乗り方とかと似ていて、
最初は難しいけどやっていくうちに感覚が分かってきて、
そうなるとスイスイできるようになります。
難しいところでくじけちゃうと自転車になかなか乗れない。
まー乗れなくても普通は困らないっつーか
特に日本企業では目立たないので怖いところでもあるけれど、、、
せっかくこの記事を読んでいただいたので、
【予測するときは平均値と標準偏差!】
まずはこの一文を頭の片隅において、
仕事に生かして頂ければと思います。
参考文献
- 作者: イアンエアーズ,Ian Ayres,山形浩生
- 出版社/メーカー: 文藝春秋
- 発売日: 2010/06/10
- メディア: 文庫
- 購入: 34人 クリック: 303回
- この商品を含むブログ (76件) を見る
ということで、補講なので、宿題はなし!
次回をお楽しみにー!