焦点

でっかいことに焦点を

【データサイエンティスト007】ハードスキルの理解⑦

今日で1週間目。

昨日の最後に「明日は動かしてみる」と書いてみたけど動かせず、、、。

 

というか何がなにやらさっぱり状態。

今わからないことを書き起こすことで後々のためになる(といいな)。

 

Hadoopって結局何のためのもの?(目的/ゴール)

  →大規模データベースの蓄積と分析を行うためのソフトウェア

Hadoopって何?(全体像)

  →Googleの論文を元にDugさんという方が開発したソフト。

   分散ファイルシステムフレームワークからなる。

・どうやって使う?(導入)

・まず何すればいい?

 

とりあえずわかったことはHadoopという名前の由来。

Dugさんのお子さんが持ってた象のぬいぐるみの名前らしい。笑

ぬいぐるみを作った人もその名前がここまで世界的に有名になるとは想像だにしなかったでしょう、、、。

 

ということで明日はRDBMSについてもう少し深堀してみることとします。

 

最後に今日参考としたページと毎日紹介しているバイブルを。

分散処理技術「Hadoop」とは:NTTデータのHadoopソリューション

 

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)

 

 

ほな!