Une rentrée bien silencieuse…

S’il est vrai que mon rythme de publication a bien ralenti dernièrement, ne vous inquiétez pas, c’est pour de saines raisons !

J’en avais déjà parlé, et vous l’avez certainement vu à travers mes récentes lectures, je travaille à fond sur ma veille technologique. Avec David nous avons la chance de disposer d’un peu de bande passante pour la R&D, on ne pourra pas nous reprocher de n’avoir su en profiter :

  • Big Data avec Pig et Hive sur HDInsight (Hadoop sur Azure, le cloud Microsoft). David présente même une session sur le sujet au SQLSat ce samedi
  • Passage de la certification ScrumMaster. Alors oui le plus gros critère de notation c’est la présence à la formation payante, mais bon… C’est qui les patrons de la BI Agile maintenant ? 😉
  • Et surtout un gros focus sur Machine Learning à travers : la formation Coursera de Stanford (spéciale dédicace à notre camarade de classe Geoffrey), 10 semaines de cours sur la théorie et son application dans Octave (un dérivé Open Source de MatLab). Et là on enchaine sur le parcours certifiant de Data Scientist de l’Université Johns Hopkins, toujours sur Coursera, 10 modules de 4 semaines, cette fois en employant R.

Maintenant je peux le dire : franchement, le Machine Learning, ça déchire.

Je vais bien sûr vous faire découvrir (ou dépoussiérer) la discipline prochainement via une série d’articles, mais je voulais avant cela bien digérer le tout. En effet une des premières leçons qui m’a été transmise est la suivante (via Drew Conway) :

Diagramme des compétences requises en Data SciencePetit jeu: saurez-vous placer le spécialiste BI là-dessus ?

  • Hacking Skills (capacité technique) : Check !
  • Expertise métier ? Derrière une bonne modélisation dimensionnelle se cache une belle compréhension du métier : Check !
  • Math et Stats : bof bof…

Vous l’avez deviné, en plein dans la Danger Zone !

Archer et Lana, quote Danger Zone

Je vous laisse lire l’article qui va avec pour creuser, mais vous comprendrez donc que j’avance prudemment sur le sujet. Parce qu’il ne faudrait pas que sous prétexte d’occuper le terrain, je vous enduise d’erreurs 😉

 

J’ai suivi la formation Data Analyst avec Hadoop et Pig, Hive et Impala par Cloudera (et c’était bien!)

Avec mon camarade David nous avons eu la chance de pouvoir participer à cette formation au nom un peu long, mais définitivement dans notre nouveau périmètre Big Data.

Déjà on peut s’interroger de pourquoi faire une formation Cloudera, éditeur d’une des distributions Hadoop les plus importantes, la CDH, alors que David et moi sommes plutôt orientés Microsoft (pour faire dans l’euphémisme).

Parce que pour rappel, le partenaire officiel de Microsoft sur le Big Data n’est autre qu’Hortonworks, concurrent de Cloudera et également contributeur majeur à l’écosystème Hadoop. Les fruits de la collaboration entre Microsoft et Hortonworks étant bien entendu la distribution HDP for Windows à installer chez soi, et également HDInsight, le Big Data à la demande directement dans le cloud.

Alors oui, pourquoi une formation Cloudera ? D’abord parce que Pig et Hive, les deux langages de manipulation de données les plus utilisés sur Hadoop, sont évidemment communs à toutes les distributions. Ensuite parce que cette formation est dispensée par Xebia, la société copine de Cellenza, que leurs formateurs sont ultra réputés, et vous vous en doutez, qu’on a eu un prix 😉

Certificat pour la formation Cloudera

Du formateur on peut en parler, il s’agissait de Kris Geusebroek (twitter), consultant sénior de GoDataDriven, filiale de Xebia Hollande spécialisée sur le Big Data (oui ça reste en famille ;)). Et il a été très très bon. L’avantage d’avoir un consultant c’est évidemment qu’il nous a apporté une vraie vision terrain, avec des pratiques et méthodes qui n’apparaissent pas habituellement dans une formation éditeur et qui pourtant sont essentielles.

Le contenu quant à lui était également au top, tant sur la forme que sur le fond. Autant vous dire que ça nous a sérieusement décomplexés par rapport à ces nouvelles technos. Une fois l’architecture globale bien comprise, Hive et Impala c’est plus ou moins du SQL, Pig ça ressemble beaucoup à du M (le langage derrière Power Query), et du nettoyage de données ça reste du nettoyage de données, qu’on le fasse avec un ETL ou sur un cluster Hadoop.

Vous l’avez compris je recommande chaudement cette formation, même si le mieux pour vous serait surement d’attendre que des spécialistes de l’écosystème proposent une déclinaison du contenu pour HDInsight, et ça, ça ne devrait pas tarder… 😉

Quoi de neuf docteur ? (Mai 2014)

Ceci est un article RTV, « Raconte Ta Vie » comme disent les jeunes, n’hésitez donc pas à passer si mon autobiographie n’a que peu de valeur pour vous, je le comprends complétement 😉

Alors il paraît qu’en mai, on fait ce qu’il nous plait? Bin cette année pour moi c’est fait !

D’abord je change de job. J’abandonne, non sans un pincement au cœur, une équipe de consultants fantastiques – et un client génial d’ailleurs – ils se reconnaitront, pour monter une nouvelle équipe chez Cellenza: le pôle Data & Analytics.

I love you

Excellente fin de saison soit dit en passant!

A mes potes qui ne bossent pas dans le secteur, je leur dis juste que je vais faire la même chose en mieux payé. Mais à vous je peux en dire plus !

Cellenza est sur un modèle pur-player Microsoft, je retrouve donc des experts et des vrais développeurs, disponibles en interne pour construire des offres commerciales complètes. De l’autre côté je perds la facilitation de la veille concurrentielle venant de l’aspect cross-techno de ma précédente société (IBM Cognos, QlikView, Tableau…). On ne peut pas tout avoir !

Cellenza est spécialiste de l’Agilité et de l’ALM, et ça ça me va très bien. Il faut dire que Cellenza est la petite sœur de Xebia, qui pour ceux qui ne connaissent pas est un concurrent direct d’Octo ou Valtech, toutes œuvrant principalement dans le monde Java, et qui est une référence de l’Agilité et… du Big Data, puisqu’ils sont le partenaire exclusif de Cloudera pour le training en France.

Et c’est de là que vient le plus gros changement sur mon poste, car si j’ai considérablement réduit la voilure en termes de collaborateurs managés, c’est pour libérer de la bande passante et concentrer mes efforts sur l’adoption des nouvelles technos, que ce soit du Cloud, du Big Data ou de la Data Science, à travers des démarches Leans et Agiles.

Je commence le 2 juin, souhaitez-moi bonne chance 😉

Congratulations

Également au programme à court terme, une véritable tournée européenne (genre) avec :

  • Le 28 juin, une session présentée à Cologne en Allemagne avec Jordan (avec qui j’avais déjà fait une session aux JSS2013) au SQL Saturday Rheinland sur la BI Agile, justement. Avec nous JP et David avec une session sur SSIS vs Power Query
  • Le 19 juillet, au SQLBits en Angleterre, David et moi on ira supporter JP pour présenter un sujet sur le Data Stewardship
  • Le 13 septembre, de retour en France pour le SQL Saturday Paris 2014

Enfin, si vous avez aimez mon petit article sur Kimono + Power Query, sachez que je présente le truc en webcast la semaine prochaine via le GUSS.

Et sinon je suis en vacances, mais j’ai l’impression de bosser toute la journée. C’est normal ? 😉

 

Retour du MVP Summit, et des Journées SQL Server 2013 !

Me voilà enfin revenu du MVP Summit (après une escale d’une semaine à San Francisco) juste à temps pour participer aux JSS2013 qui ont eu lieu ces lundi et mardi.

Pour le MVP Summit, je ne peux malheureusement rien vous dire de concret, les rappels NDA ayant été assez violents. Cela dit, et par rapport aux évolutions importantes que subit l’offre décisionnelle de Microsoft en ce moment, je ne vous ferai pas le coup classique du « faites confiance à Microsoft ». D’abord parce que la confiance n’a rien à faire dans l’histoire, ensuite parce qu’on ne fait pas confiance à une entité mais à des individus.

Je vous dirais donc plutôt que les choix qui sont faits vis-à-vis des roadmaps des produits sont faits consciemment, en pesant les impacts qui en découlent sur l’offre globale et sur l’écosystème. Je vous dirais également que parmi les individus qui font ces choix, les Executives et Product Managers de Microsoft, il y a effectivement des gens brillants.

En dehors de ces considérations c’était vraiment un voyage génial. Visiter le campus de Microsoft, rencontrer les responsables et développeurs des produits qu’on utilise, rencontrer les MVP du monde entier, c’est une opportunité incroyable. Je remercie sincèrement tous les gens qui contribuent à ce programme.

Un burger à Seattle

Au moins les burgers ne sont pas sous NDA 😉

On revient en France avec les Journées SQL Server, qui se sont déroulées en ce début de semaine. Au final plus de 350 présents, un super feedback sur la qualité globale du contenu (y’a toujours des efforts à faire mais ça s’améliore chaque année), et une communauté SQL Server de plus en plus forte.

Encore une fois merci aux sponsors, qui contribuent juste à 100% du budget de la chose vu que le GUSS est une association quasiment sans liquidité. Et merci également à tous les copains qui ont participé à l’organisation. On a bossé comme des fous les soirs et les week-ends depuis 6 mois pour monter tout ça, et c’est une vraie satisfaction de voir le résultat obtenu. Spéciale dédicace à David Joubert et Aurélien Koppel, qui ont assuré le caramel pendant que les MVPs se la coulaient douce à Seattle!

Du côté de ma session je suis vraiment content d’avoir invité Jordan Mootoosamy et Thomas Morisson à partager le temps de parole. Je les ai trouvé très bons tous les deux, tant sur le fond que sur la forme. A refaire!

Jordan présente aux JSS2013

Quelle classe ce Jordan!

Pour cette session je voulais remercier Steven Currie de Varigence, qui nous a fourni les licences Mist pour nos tests et qui a essayé de nous envoyer des jolis t-shirts à vous distribuer (un petit couac de ma faute avec la douane et ils sont repartis directement aux USA). Et également merci à Cédric, le contributeur principal de NBi, pour ses réponses à mes questions de newbie sur son outil…

Au niveau de l’audience la salle était pleine, soit autour de 60 personnes. J’en profite pour remercier tous ceux qui sont venus. C’est sincèrement super satisfaisant de voir que les sujets traités intéressent autant de monde ! Si vous étiez là, n’hésitez pas à nous faire votre retour dans les commentaires.

Enfin, je mets à votre disposition les slides de cette session Pratiques et Outils pour la BI Agile. (MàJ : le webcast est maintenant dispo). Les présentations des autres sessions des JSS devraient bientôt arriver sur le site du GUSS, et également les vidéos, puisque tout a été enregistré.

SQLSaturday à Paris – Samedi 14 Septembre!

Samedi 14 Septembre 2013 (Event Time Announcer) aura lieu à Paris le premier SQLSaturday en France.

SQLSAT251_web_thumb1

D’abord, c’est quoi un SQLSaturday ? C’est un événement organisé par le PASS, Professional Association for SQL Server, l’association officielle des utilisateurs de SQL Server. Je dis officielle car c’est celle qui est reconnue internationalement par Microsoft. Et le « local chapter » pour le PASS en France, vous vous en doutez bien, c’est le GUSS, le Groupe des Utilisateurs francophones de SQL Server.

GUSS Logo

Si le PASS global organise principalement le PASS Summit, habituellement les chapters organisent eux deux types d’événements : les SQLRally et les SQLSaturday :

  • PASS Summit : Plus grosse conférence SQL Server dans le monde, annuelle, traditionnellement à Seattle mais cette année à Charlotte, payante (+/- 1500€) avec les meilleurs speakers mondiaux
  • SQLRally : Conférences de quelques jours, plus locales, également payantes (+/- 500€) avec un contenu premium
  • SQLSaturday : Training d’une journée, communautaire, gratuite, occasion d’apprendre pour les participants comme pour les speakers. NB : ne se déroule pas forcément un samedi.

Et c’est là que vous comprenez pourquoi depuis 2 ans les Journées SQL Server, l’événement que nous organisons avec le GUSS en décembre, ne portent pas l’étiquette PASS : elles ne rentrent pas dans la structure marketing actuelle de l’organisation.

Or avec le renouvellement du board du GUSS cette année, a été décidé un rapprochement de notre association de la ligne éditoriale du PASS, et donc l’organisation d’un événement qui reprend le branding global : le SQLSaturday 251 à Paris.

Avec ce rapprochement arrivent certains avantages : la possibilité d’utiliser la plateforme technique du PASS pour la logistique d’organisation (y compris les propositions de sessions pour les speakers), et justement l’accès à des speakers internationaux inscrits sur les bonnes mailings listes.

Le planning le voici (à cliquer pour voir en grand):

Planning SQLSaturday 251

Et pour cette édition 251 nous aurons donc en guest stars:

  • Jen Stirrup, MVP SQL Server, Consultante aux UK (Blog | Twitter), référence internationale sur la BI et la DataViz sur la plateforme Microsoft. Elle est dans mes flux RSS depuis le début !
  • Hugo Kornelis, MVP SQL Server, Consultant aux Pays Bas (Blog | Twitter), qui va nous expliquer à fond le tout nouveau ColumnStore Index
  • Allan Mitchell, MVP SQL Server, Consultant aux UK (Twitter), spécialiste de l’intégration de données (SSIS, DQS, MDS) qui va nous causer Hadoop et plus précisément de Hive

Plus la crème des speakers français, Christophe Laporte, David Barbarin, la team rocket, etc, etc… 😉

On pourrait s’interroger sur le fait qu’on retrouve un peu toujours les mêmes copains dans la liste, avec justesse. Sur ce coup c’est pour 2 raisons principales :

  1. D’abord pour ne pas prendre de risque sur la première édition d’un événement,
  2. Ensuite, on n’a finalement pas reçu tant de propositions que ça lors de l’appel aux speakers. En fait pas mal de speakers étrangers, mais peu de francophones, et on a essayé de pas trop forcer sur la VO non sous-titrée

Mais sachez bien que si ça marche on pourrait faire ça plusieurs fois par an, et permettre à tous ceux qui le souhaitent de s’essayer en speaker.

Dans tous les cas moi je suis fan de la programmation, ça risque de pulser assez fort, donc n’hésitez pas à réserver votre samedi 😉

PS: Et je vais faire un article bientôt sur le contenu de notre session avec le père Joubert!

Retour sur les JSS2012 – en tant que visiteur :)

Avant de vous faire un retour en mode speaker, avec comme promis les slides pour la Modélisation Dimensionnelle, je voulais faire un petit retour sur les sessions auxquelles j’avais assisté lors de cette édition 2012 des Journées SQL Server.

Parce que je ne sais pas comment vous vous l’avez vécu, mais moi j’ai constaté une vraie montée en puissance de certains speakers, tant en terme de contenu que de niveau de présence et de présentation. Ok, et en toute franchise, le niveau était loin d’être uniforme, et c’est un des sujets sur lequel on travaillera pour l’année prochaine. Mais pour moi, la présence des speakers suivant valait largement le déplacement (dans l’ordre chronologique des sessions) :

    Eric Grenon aux JSS2012

  • Eric Grenon sur le Private Cloud. Il connaît très bien son sujet et j’ai bien accroché avec ses idées. J’ai malheureusement du m’éclipser avant la fin pour des soucis d’organisation, mais définitivement une bonne découverte.

Aurélien Koppel aux JSS 2012

  • Aurélien Koppel sur SSAS Tabular. J’aime beaucoup son style un peu dandy, c’est bien préparé, ça déroule tout seul, on voit l’expérience !

Patrice Harel aux JSS2012

  • Patrice Harel, la révélation de ces JSS2012, pourtant sur un sujet assez aride : le Processing sur SSAS 2012. Comme pour son livre, on sent la maitrise et la passion pour les outils, bravo !

François Jehl et David Joubert aux JSS2012

  • Le duo François Jehl et David Joubert, sur la session DAX pour les fans de MDX. Là on avait le package complet : le fond et la forme, avec l’humour en prime. J’ai passé un excellent moment et vous l’aurez compris, c’est ma session préférée de cette édition.

Stéphane Guilleminot aux JSS2012

  • Enfin, Stéphane Guilleminot, qu’on a applaudit à la fin de son opération de chirurgie XML sur package SSIS 2012. Honnêtement je ne m’y serais pas risqué, mais lui il l’a réussie, en live.

Un gros bravo également aux speakers hors concours :

N’oublions pas ceux que je n’ai pas pu voir (3 à 4 tracks en parallèle, plus l’organisation, dur de tout suivre), je sais donc que j’en ai raté d’autres très bons 🙂

Et vous alors, qui ont été vos chouchous cette année ? Vous partagez mon avis sur le niveau qui s’améliore?

PS : Un gros bravo à la photographe, Annaelle Le Roy, car ces gens ne sont vraiment pas aussi beaux dans la vraie vie 😉