【データサイエンティスト007】ハードスキルの理解⑦
今日で1週間目。
昨日の最後に「明日は動かしてみる」と書いてみたけど動かせず、、、。
というか何がなにやらさっぱり状態。
今わからないことを書き起こすことで後々のためになる(といいな)。
・Hadoopって結局何のためのもの?(目的/ゴール)
→大規模データベースの蓄積と分析を行うためのソフトウェア
・Hadoopって何?(全体像)
→Googleの論文を元にDugさんという方が開発したソフト。
分散ファイルシステムとフレームワークからなる。
・どうやって使う?(導入)
・まず何すればいい?
とりあえずわかったことはHadoopという名前の由来。
Dugさんのお子さんが持ってた象のぬいぐるみの名前らしい。笑
ぬいぐるみを作った人もその名前がここまで世界的に有名になるとは想像だにしなかったでしょう、、、。
ということで明日はRDBMSについてもう少し深堀してみることとします。
最後に今日参考としたページと毎日紹介しているバイブルを。
分散処理技術「Hadoop」とは:NTTデータのHadoopソリューション
改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく! ] (Software Design plus)
- 作者: 佐藤洋行,原田博植,里洋平,和田計也,早川敦士,倉橋一成,下田倫大,大成弘子,奥野晃裕,中川帝人,長岡裕己,中原誠
- 出版社/メーカー: 技術評論社
- 発売日: 2016/08/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
ほな!