【データサイエンティスト011】WEBスクレイピングについて①
データサイエンティストのサービスを生み出そうとしてやり始めたシリーズ。
甘いもんじゃ無いねぇと思いつつぼちぼち進めて参ります。
といことで昨日からWEBスクレイピングに突入。
WEBスクレイピングとは、WEBから公開情報を集めてデータ分析に活用すること。
スクレイピング(scraping)の意味は、擦り付けたりすることやかき集めること、転じて、元々異なる用途、形式のデータを抽出して活用すること、らしい。
例えば気象情報など色々な情報をネットに公開して頂いているので使い方さえわかれば非常に応用範囲は広い。
使うためには大きく2つのツールを活用する必要があり、まずWEB情報を取得するアクセスツール、次に取得したデータを活用できるように加工するスクレイピングツール。ただし、両方の機能を包含したツールもある。
こうやって表面的な内容はまぁええので明日は実際にトライしてみる。。!