焦点

でっかいことに焦点を

【データサイエンティスト022】サービスを絵にする④

データサイエンティストの本を参考に勉強しつつ2月中に何らかのサービスを出そうと奮闘?している連載。

本はこれ。  

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 あとUdemyでも勉強開始ちぅ。超いい感じ。あんなに苦戦したnumpyもすいすい。

www.udemy.com

動画にして良かったことの一つ(しょぼい版)は、読み方がわかること。

numpyなんてどうやって読むか本ではわからなかったもんね。

 

ということで本筋のこのブログ。

数日前にサービスを絵にしてさっそくコードにしてデバッグして、、、と息巻いていたけれど、しかしながら、の現状。

 

さてさて。

昨日は下記3つのアイデアを少し深掘りした。

    • データベースの形を綺麗にして投げ返す
    • 時系列/層別/主成分分析 などなど無数にある手法でグラフ化し、意味付きで投げ返す
    • 今後のデータを予測して精度とともに投げ返す

この中で2つ目を昨日は自動分析ツールかなぁという話までいった。

自動分析ツールで一回考えてみようか。

そのまますると月並み感が満載。

ターゲットはエクセルしか手元にない人、でいこうか。

いったんTableau使ってみなわからんかな。それは明日やってみるとして。

 

大量のデータ(〜10万)を集約して時系列にまとめてクラスター分析できるようにする程度のツールから入ろうか。

ほぼRの基本そのままやな。

 

付加価値は何があるか。どこが嬉しい?

ざっくりした(欠測値の多い)データでも判断してくれる。

最速で答えが出る(これは今のパソコンでこの情報量なら問題ないか・・・)。

xlsxファイルからボタン一つでグラフ化してくれる。

入出力周りの簡素化が差別化、か。

まずはシンプルイズベストで作ってみよう。

 

ここまでシンプルになったら絵はいらんな。

明日Tableauで遊んでみて、あとはUdemyを進めて、サンプルソフトでも作りにかかってみよう。

 

方針決定!

あと6日!