焦点

でっかいことに焦点を

【データサイエンティスト025】サービスを検討③

タブローTableauさんに打ちのめされる、、

 

2017年2月、バズワードのデータサイエンティストにのっかってみて何か出ないかと模索を始めた 。

25日、タブローTableauさんの完成度に改めて衝撃を受けております、、、さすがすぎる。

 

背景からいくと、下記の本を読んでみたけどぜーんぜん頭に入らず。それでも、今の自分に必要そうだという感覚を得たので、一念発起、このブログでサービス化をやるぞと、そういうことで、スタートしました。

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 

お勉強してプログラムも自分で書いてみて多少見通しが良くなってきた今日この頃。

いよいよこの業界を席巻しているタブローTableauさんを少しかじってみました。

www.tableau.com

 

まず導入事例を見てみるとリクルートさんやPepsiCoさんなどわらわら出てくる出てくる。

 

何をするソフトかというと、大量のデータをサクサクとビジュアライズして分析できるもの。

エクセルではちょっと、、、という量、項目数も一項目あたりのデータ数もいずれも、そんなデータと向き合うなら導入すべき!かなと。

 

会社の行動原理もさすが良く掴んでいてミニマムスタンドアローン1パッケージ保守費混み24万円という稟議などいらない絶妙な価格設定。

 

大企業ならこの金額を出しても十分ペイするでしょうと。

地図プロットとかもしてくれるしね。

 

ここでは、タブローさんを最高位としてベンチマークしつつ、中小とか、大企業でも上司がぐちゃぐちゃ言ってくるような人に向けた簡易版を設計して進めていこう。

 

エクセルではつらい、数十万出すほどでもない。

うん、ニーズはありそうだ(つか今俺が欲しい)。

今僕がぶち当たってるのは過去五年分の月次データ、項目数が二万以上。

欠測値とか異常値もばんばん入ってるし目でどうこうするのは時間的、モチベーション的に無理がある、、、。

 

したいことは

  • 欠測値、異常値の可視化と修正
  • トレンドの図示と把握
  • 絶対量、変化率それぞれの観点から特徴的な項目を抽出。

この3つ。

これらをPythonさんで何とかやっていこう。

 

やべぇ、あと3日!