【データサイエンティスト030】どこからせめていくか
2017年2月1日から、データサイエンティストでサービス化をめがけてのそっと活動をスタートしたブログ。
2月中にサービスは出なかったけれど、色々と本を読んだりサービスを使ってみたりして見えてくる世界が広がってはきた。
ということで今日は現時点の悩みと解決策を紹介して、これからやってみよう!という人の一歩目つまづきを解消できればいいな、ということで。
プロになると素人の困りごとが逆にわかりにくくなるしね(教えることのプロならわかるのかも?)
ということで。自分が困ったこと順にいこうか。
・データサイエンティストってそもそも何?
→多数の(エクセルでしんどいくらいの)データを解釈してビジネスの結果に反映できるスキルを持った人。スキルは統計やITのハード系とビジネスや人間関係のソフト系に分けられる。ソフト系?ってなるけど、結局ビジネスで結果を出すために何に困っているのか、どうなりたいのか、そのためにどれだけのリソースが使えるのか、そういったことを明らかにするためにはソフト系の技術がやっぱり必要になる。ただ、一人でハードからソフトまで全てを担える人材(イメージはYahoo!の村上執行役員みたいなひと?)はほぼ存在しないメタモン状態なのが現状のようで、各スキルそれぞれに特化した人材をチームとして組み合わせて業務でアウトプットに繋げようとしているみたい。
・なんでデータサイエンティストが騒がれているの?
→上につながるけど、たくさんのデータが簡単に取れるようになったから。iPhoneから始まるスマホは一つの転機だったと思う。iPhoneなんてセンサーの塊で光学、加速度、GPS、さらには気圧計まで入ってるし。そういったデータを目的をもって分析して定量的な判断材料に料理してあげる人が求められるようになってきた。ただ勝手に集まってきたデータをこねるより仮説をもってデータを集めた方が精度が高いという記述もみられるけど、これからPCで寄与度の高い項目を自動抽出できるようになるとただただデータを集めてくる方法もありになるのかな。まぁ集まってきたデータを予備分析としてスクリーニング程度に使って、ABスプリットテスト(ウェブで2種類の広告をランダムに表示して効果が出た方を採用する手法。実際はCDE、、とやってるんでしょうきっと)で本分析し方針決定するという手法が今のところは落とし所になるかな。
・データサイエンティスト、目指してみよう!まず何をすればいい?
→うーん、それは俺も悩み中。笑 ハード系スキルを身に付けるなら個人的には構造化プログラミングのPADがいいんやけど超下火。PADは、フローチャートみたいに(違うんやけど)プログラムを構造化して検討に使える上、フローチャートに比べ仕上がりがそのままプログラム言語に落としやすいので個人的に気に入ってるんやけどなぁ。なんでか盛り上がってない。ただオブジェクト思考になるとクラス図やアクティビティ図が上位概念として必要になるみたい。習うより慣れろ、の文化が(日本の?)プログラマーの少なくとも一部には流れている気配もする。
ハード系スキルで、PADの次はPythonかな。多分。統計好きなイカれ気味の人にはRが激おすすめ。凝った処理がいっぱい標準装備されている。ネットでも比較的情報があるし。ただPythonやRを自分でやろうとしても挫折するので(俺は挫折したので、か)、現時点でPythonに関してはUdemyの講座がいいかな。今まで悩んでたことが嘘のように解決してどんどん進んでいる。Rに関してはよくわからないけど、、、身近で好きな人を見つけるのが近道かな。まぁPythonでもUdemyには限らないけど、時間をショートカットするため、自力でごりごりにこだわらずいろんなサービスを活用していってみることをオススメしたい。
ソフト系スキルは難しいけどまずはロジックかな。MECEに分ける、的な。そして一般的な問題解決手法を息を吸って吐くように使えるべし。つって俺ができてるみたいに書いてすみません。この手の本はたくさんあるので自主学習した上で、実務でたたかれもまれて身に付けることもいいかと。ハード系スキルに比べるとソフト系スキルを持っている人の数は圧倒的に多いやろうし。
ということで今日はこの辺で。
時々自分の悩んでいることを書き下して残しておこうと思う。