読者です 読者をやめる 読者になる 読者になる

焦点

でっかいことに焦点を

【データサイエンティスト021】サービスを絵にする③

データサイエンティストの本を参考に勉強しつつ2月中に何らかのサービスを出そうと奮闘?している連載。

本はこれ。 

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 あとUdemyでも勉強開始しました。

www.udemy.com

非常に懇切丁寧で良い。よすぎる。

とはいえちょっと詰まったので今からやる人のためにも少しメモ。

できる人にとっては、フン!という感じだと思うので読み飛ばしてください。

・あれ、ターミナルのコマンドってなんやったっけ・・・?

→ターミナルとはパソコンのフォルダ(ディレクトリ)やファイルをコマンドでいじくるやつですね。詳細は下記にゆずろう。

今さら聞けない!ターミナルの使い方【初心者向け】 | TechAcademyマガジン

・そもそもAnacondaでちょっとけつまづいた、、、

→下をみてなんとかしてみました。

Anaconda で Python 環境をインストールする - Qiita

 

さて、もう3日目に突入したサービスを絵にするやつ。

昨日達したレベルはここ。

  • データベースの形を綺麗にして投げ返す
  • 時系列/層別/主成分分析 などなど無数にある手法でグラフ化し、意味付きで投げ返す
  • 今後のデータを予測して精度とともに投げ返す

ここでだれにどんな価値になるのか考えてみようか。

一つ目は、データサイエンティスト見習いくらいか。

教育は素人向けが一番いい(対象者が多い)という話もあるしナイスかな。
具体的にどんなサービスにするかが見えん。
定量的か定性的か、時系列か同時期の別要素比較か。。

 

二つ目は、自動分析ツールね。これは欲しい。ピボットテーブルさえ面倒な時があるし。ボタン一つで、的な。

ここの課題は知りたいことに突き刺さる分析をどう自動判別するかやな。

データセットの形から見極めるとナイス。でも変化が見えやすいようにしたいしな。

ピボットテーブルの下の表になる形式からあらゆるグラフがかけるマクロ的なのがあればいいのか。

 

三つ目は、外挿して試算するツールか。恐ろしいな。伸び率一定とかCAGRでいくとか方法はあるけど精度は神のみぞ知る世界。。ちょっと二の足を踏むところ。

 

うーん、今日はここまで。

あと7日!