読者です 読者をやめる 読者になる 読者になる

焦点

でっかいことに焦点を

【データサイエンティスト012】WEBスクレイピングについて②

えー、データサイエンティストの本を参考にしつつ、何らかのサービスまで持っていきたいと悪戦苦闘している戦いブログ。

ということで。

個人的に今週休みとなり、旅先で検討中です。

 

昨日からWEBスクレイピングについて勉強中。

WEBスクレイピングとは、オンラインで公開されている情報を集めてきて、データ分析に活用しようという手法。

 

今日はできることをまとめて書いてみる。

なかなかに面白い。

 

wiki情報を集約(企業の売り上げ額とか)

wikiの項目文字数をカウント(これは取ってくる意味が今の所掴めてない)

 

この本はあくまで導入ということで適度なディレイなどにも言及頂いているけど先は長く奥は深そう。

 

実際に自分でやってみたいけど、とりあえず、明日は次のTableau(タブロー)についてお勉強してみる。