焦点

でっかいことに焦点を

【データサイエンティスト001】 ちょっくら目指してみる。

前から興味があってちょっとRをかじったりしていたけれど良書を発見したので2月は掘り返してみることにする。

実体験を積んでもう少しディープなことができるように。

いろんなデータは手元にあるので活用できる下地を。

 

ということでその良書の紹介から。

 

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 データを扱うスキルに加えてビジネス上どのように展開するか、まで広く網羅。

ただこの本を評価できるようなレベルにないので2月は愚直にやってみよう。

1日10分、今月は280分で4時間40分。どこまでできるか。

 

ということで1回目。

必要なスキルは大きく2種類に分けられ、ハードスキルとソフトスキル。

もう1段階ブレイクダウンすると、ハードスキルはIT系スキルと分析系スキルの2種類に分けられ、ソフトスキルはビジネス系スキルの1種類、合計3種類ですね。

私はやっぱりハードスキルに惹かれるなー。かっちょええ。そのハードスキルに必要なものは、データ分析フェーズにもよるけど、

  • RDBMS(Relational Database Management System:SQL(1970年以降スタンダードなデータベース言語)をおもなデータベース言語とするデータベース))とSQLの知識・実務経験。さらにHadoopと関連知識(JAVAHDFS (Hadoop Distributed File System)、MapReduce、HIVE、pigなど)が必要かも。Linuxコマンドによるデータ処理も。
  • 統計解析や機械学習に関する知識、R、PythonPerl、Mahout、MADlibなどのライブラリ、リアルタイム処理をするならJubatus。
  • GUIを持つツールを利用する場面もあるとか。SASSPSS(統計分析ツール)場合によってはKXEN、ローカル限定ならKNIMEも。

うーん、面白くなってきた。笑

ソフトスキル=ビジネス系スキルはいろんな本もあるし、今は業務でも実践的に学んでいるので、ハード系スキルをつけよう。

今月中に何らかのサービスとしてアウトプットできると最高。

 

ぼちぼちお願いしますー。