J’ai suivi la formation Data Analyst avec Hadoop et Pig, Hive et Impala par Cloudera (et c’était bien!)

Avec mon camarade David nous avons eu la chance de pouvoir participer à cette formation au nom un peu long, mais définitivement dans notre nouveau périmètre Big Data.

Déjà on peut s’interroger de pourquoi faire une formation Cloudera, éditeur d’une des distributions Hadoop les plus importantes, la CDH, alors que David et moi sommes plutôt orientés Microsoft (pour faire dans l’euphémisme).

Parce que pour rappel, le partenaire officiel de Microsoft sur le Big Data n’est autre qu’Hortonworks, concurrent de Cloudera et également contributeur majeur à l’écosystème Hadoop. Les fruits de la collaboration entre Microsoft et Hortonworks étant bien entendu la distribution HDP for Windows à installer chez soi, et également HDInsight, le Big Data à la demande directement dans le cloud.

Alors oui, pourquoi une formation Cloudera ? D’abord parce que Pig et Hive, les deux langages de manipulation de données les plus utilisés sur Hadoop, sont évidemment communs à toutes les distributions. Ensuite parce que cette formation est dispensée par Xebia, la société copine de Cellenza, que leurs formateurs sont ultra réputés, et vous vous en doutez, qu’on a eu un prix 😉

Certificat pour la formation Cloudera

Du formateur on peut en parler, il s’agissait de Kris Geusebroek (twitter), consultant sénior de GoDataDriven, filiale de Xebia Hollande spécialisée sur le Big Data (oui ça reste en famille ;)). Et il a été très très bon. L’avantage d’avoir un consultant c’est évidemment qu’il nous a apporté une vraie vision terrain, avec des pratiques et méthodes qui n’apparaissent pas habituellement dans une formation éditeur et qui pourtant sont essentielles.

Le contenu quant à lui était également au top, tant sur la forme que sur le fond. Autant vous dire que ça nous a sérieusement décomplexés par rapport à ces nouvelles technos. Une fois l’architecture globale bien comprise, Hive et Impala c’est plus ou moins du SQL, Pig ça ressemble beaucoup à du M (le langage derrière Power Query), et du nettoyage de données ça reste du nettoyage de données, qu’on le fasse avec un ETL ou sur un cluster Hadoop.

Vous l’avez compris je recommande chaudement cette formation, même si le mieux pour vous serait surement d’attendre que des spécialistes de l’écosystème proposent une déclinaison du contenu pour HDInsight, et ça, ça ne devrait pas tarder… 😉

Quoi de neuf docteur ? (Mai 2014)

Ceci est un article RTV, « Raconte Ta Vie » comme disent les jeunes, n’hésitez donc pas à passer si mon autobiographie n’a que peu de valeur pour vous, je le comprends complétement 😉

Alors il paraît qu’en mai, on fait ce qu’il nous plait? Bin cette année pour moi c’est fait !

D’abord je change de job. J’abandonne, non sans un pincement au cœur, une équipe de consultants fantastiques – et un client génial d’ailleurs – ils se reconnaitront, pour monter une nouvelle équipe chez Cellenza: le pôle Data & Analytics.

I love you

Excellente fin de saison soit dit en passant!

A mes potes qui ne bossent pas dans le secteur, je leur dis juste que je vais faire la même chose en mieux payé. Mais à vous je peux en dire plus !

Cellenza est sur un modèle pur-player Microsoft, je retrouve donc des experts et des vrais développeurs, disponibles en interne pour construire des offres commerciales complètes. De l’autre côté je perds la facilitation de la veille concurrentielle venant de l’aspect cross-techno de ma précédente société (IBM Cognos, QlikView, Tableau…). On ne peut pas tout avoir !

Cellenza est spécialiste de l’Agilité et de l’ALM, et ça ça me va très bien. Il faut dire que Cellenza est la petite sœur de Xebia, qui pour ceux qui ne connaissent pas est un concurrent direct d’Octo ou Valtech, toutes œuvrant principalement dans le monde Java, et qui est une référence de l’Agilité et… du Big Data, puisqu’ils sont le partenaire exclusif de Cloudera pour le training en France.

Et c’est de là que vient le plus gros changement sur mon poste, car si j’ai considérablement réduit la voilure en termes de collaborateurs managés, c’est pour libérer de la bande passante et concentrer mes efforts sur l’adoption des nouvelles technos, que ce soit du Cloud, du Big Data ou de la Data Science, à travers des démarches Leans et Agiles.

Je commence le 2 juin, souhaitez-moi bonne chance 😉

Congratulations

Également au programme à court terme, une véritable tournée européenne (genre) avec :

  • Le 28 juin, une session présentée à Cologne en Allemagne avec Jordan (avec qui j’avais déjà fait une session aux JSS2013) au SQL Saturday Rheinland sur la BI Agile, justement. Avec nous JP et David avec une session sur SSIS vs Power Query
  • Le 19 juillet, au SQLBits en Angleterre, David et moi on ira supporter JP pour présenter un sujet sur le Data Stewardship
  • Le 13 septembre, de retour en France pour le SQL Saturday Paris 2014

Enfin, si vous avez aimez mon petit article sur Kimono + Power Query, sachez que je présente le truc en webcast la semaine prochaine via le GUSS.

Et sinon je suis en vacances, mais j’ai l’impression de bosser toute la journée. C’est normal ? 😉