【データサイエンティスト001】 ちょっくら目指してみる。
前から興味があってちょっとRをかじったりしていたけれど良書を発見したので2月は掘り返してみることにする。
実体験を積んでもう少しディープなことができるように。
いろんなデータは手元にあるので活用できる下地を。
ということでその良書の紹介から。
改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)
- 作者: 佐藤洋行,原田博植,里洋平,和田計也,早川敦士,倉橋一成,下田倫大,大成弘子,奥野晃裕,中川帝人,長岡裕己,中原誠
- 出版社/メーカー: 技術評論社
- 発売日: 2016/08/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
データを扱うスキルに加えてビジネス上どのように展開するか、まで広く網羅。
ただこの本を評価できるようなレベルにないので2月は愚直にやってみよう。
1日10分、今月は280分で4時間40分。どこまでできるか。
ということで1回目。
必要なスキルは大きく2種類に分けられ、ハードスキルとソフトスキル。
もう1段階ブレイクダウンすると、ハードスキルはIT系スキルと分析系スキルの2種類に分けられ、ソフトスキルはビジネス系スキルの1種類、合計3種類ですね。
私はやっぱりハードスキルに惹かれるなー。かっちょええ。そのハードスキルに必要なものは、データ分析フェーズにもよるけど、
- RDBMS(Relational Database Management System:SQL(1970年以降スタンダードなデータベース言語)をおもなデータベース言語とするデータベース))とSQLの知識・実務経験。さらにHadoopと関連知識(JAVA、HDFS (Hadoop Distributed File System)、MapReduce、HIVE、pigなど)が必要かも。Linuxコマンドによるデータ処理も。
- 統計解析や機械学習に関する知識、R、Python、Perl、Mahout、MADlibなどのライブラリ、リアルタイム処理をするならJubatus。
- GUIを持つツールを利用する場面もあるとか。SASやSPSS(統計分析ツール)場合によってはKXEN、ローカル限定ならKNIMEも。
うーん、面白くなってきた。笑
ソフトスキル=ビジネス系スキルはいろんな本もあるし、今は業務でも実践的に学んでいるので、ハード系スキルをつけよう。
今月中に何らかのサービスとしてアウトプットできると最高。
ぼちぼちお願いしますー。