【データサイエンティスト022】サービスを絵にする④
データサイエンティストの本を参考に勉強しつつ2月中に何らかのサービスを出そうと奮闘?している連載。
本はこれ。
改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)
- 作者: 佐藤洋行,原田博植,里洋平,和田計也,早川敦士,倉橋一成,下田倫大,大成弘子,奥野晃裕,中川帝人,長岡裕己,中原誠
- 出版社/メーカー: 技術評論社
- 発売日: 2016/08/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
あとUdemyでも勉強開始ちぅ。超いい感じ。あんなに苦戦したnumpyもすいすい。
動画にして良かったことの一つ(しょぼい版)は、読み方がわかること。
numpyなんてどうやって読むか本ではわからなかったもんね。
ということで本筋のこのブログ。
数日前にサービスを絵にしてさっそくコードにしてデバッグして、、、と息巻いていたけれど、しかしながら、の現状。
さてさて。
昨日は下記3つのアイデアを少し深掘りした。
-
- データベースの形を綺麗にして投げ返す
- 時系列/層別/主成分分析 などなど無数にある手法でグラフ化し、意味付きで投げ返す
- 今後のデータを予測して精度とともに投げ返す
この中で2つ目を昨日は自動分析ツールかなぁという話までいった。
自動分析ツールで一回考えてみようか。
そのまますると月並み感が満載。
ターゲットはエクセルしか手元にない人、でいこうか。
いったんTableau使ってみなわからんかな。それは明日やってみるとして。
大量のデータ(〜10万)を集約して時系列にまとめてクラスター分析できるようにする程度のツールから入ろうか。
ほぼRの基本そのままやな。
付加価値は何があるか。どこが嬉しい?
ざっくりした(欠測値の多い)データでも判断してくれる。
最速で答えが出る(これは今のパソコンでこの情報量なら問題ないか・・・)。
xlsxファイルからボタン一つでグラフ化してくれる。
入出力周りの簡素化が差別化、か。
まずはシンプルイズベストで作ってみよう。
ここまでシンプルになったら絵はいらんな。
明日Tableauで遊んでみて、あとはUdemyを進めて、サンプルソフトでも作りにかかってみよう。
方針決定!
あと6日!