This blog is no longer updated. Please check my new blog here.

Julien Sobczak

Hadoop: The Definitive Guide

Tom White

Le livre le plus complet sur un écosystème utilisé par les géants du Web. Si vous avez besoin d'Hadoop, vous aurez besoin de ce livre pour accompagner vos débuts et probablement d'expertise supplémentaire car maîtriser Hadoop n'est pas une mince affaire !

General

ebook 1449396992 628 pages

Review

Il a “BigData” et Big Data. Hadoop joue dans la seconde catégorie.

Hadoop peut être vu comme l’implémentation des papiers MapReduce et GFS publiés par Google en 2004 et 2003 respectivement. Mais c’est aussi bien plus et il est préférable de le voir comme un écosystème composé également de HBase, Pig, Hive, ZooKeeper, …

Hadoop va vous permettre de libérer le potentiel de votre masse de données, qu’importe sa taille puisque Hadoop constitue la base qui permet à Yahoo de satisfaire vos recherches, tout comme Facebook qui l’utilise massivement aussi !

Mais voilà, une telle puissance s’accompagne logiquement d’une certaine complexité. Revient donc à Tom White, commiteur sur le projet, la délicate tâche de nous l’expliquer et globalement, il s’en sort honorablement.

Le principal défaut récurrent de ce livre est sa non conformité avec les APIs qui n’ont cessées de changer. Le produit est encore jeune mais la bonne nouvelle est que ce livre est régulièrement remis à jour puisqu’une troisième édition est apparue en 2012. (soit éditions en moins de ans !)