Quoi de neuf docteur ? (Mai 2014)

Ceci est un article RTV, « Raconte Ta Vie » comme disent les jeunes, n’hésitez donc pas à passer si mon autobiographie n’a que peu de valeur pour vous, je le comprends complétement 😉

Alors il paraît qu’en mai, on fait ce qu’il nous plait? Bin cette année pour moi c’est fait !

D’abord je change de job. J’abandonne, non sans un pincement au cœur, une équipe de consultants fantastiques – et un client génial d’ailleurs – ils se reconnaitront, pour monter une nouvelle équipe chez Cellenza: le pôle Data & Analytics.

I love you

Excellente fin de saison soit dit en passant!

A mes potes qui ne bossent pas dans le secteur, je leur dis juste que je vais faire la même chose en mieux payé. Mais à vous je peux en dire plus !

Cellenza est sur un modèle pur-player Microsoft, je retrouve donc des experts et des vrais développeurs, disponibles en interne pour construire des offres commerciales complètes. De l’autre côté je perds la facilitation de la veille concurrentielle venant de l’aspect cross-techno de ma précédente société (IBM Cognos, QlikView, Tableau…). On ne peut pas tout avoir !

Cellenza est spécialiste de l’Agilité et de l’ALM, et ça ça me va très bien. Il faut dire que Cellenza est la petite sœur de Xebia, qui pour ceux qui ne connaissent pas est un concurrent direct d’Octo ou Valtech, toutes œuvrant principalement dans le monde Java, et qui est une référence de l’Agilité et… du Big Data, puisqu’ils sont le partenaire exclusif de Cloudera pour le training en France.

Et c’est de là que vient le plus gros changement sur mon poste, car si j’ai considérablement réduit la voilure en termes de collaborateurs managés, c’est pour libérer de la bande passante et concentrer mes efforts sur l’adoption des nouvelles technos, que ce soit du Cloud, du Big Data ou de la Data Science, à travers des démarches Leans et Agiles.

Je commence le 2 juin, souhaitez-moi bonne chance 😉

Congratulations

Également au programme à court terme, une véritable tournée européenne (genre) avec :

  • Le 28 juin, une session présentée à Cologne en Allemagne avec Jordan (avec qui j’avais déjà fait une session aux JSS2013) au SQL Saturday Rheinland sur la BI Agile, justement. Avec nous JP et David avec une session sur SSIS vs Power Query
  • Le 19 juillet, au SQLBits en Angleterre, David et moi on ira supporter JP pour présenter un sujet sur le Data Stewardship
  • Le 13 septembre, de retour en France pour le SQL Saturday Paris 2014

Enfin, si vous avez aimez mon petit article sur Kimono + Power Query, sachez que je présente le truc en webcast la semaine prochaine via le GUSS.

Et sinon je suis en vacances, mais j’ai l’impression de bosser toute la journée. C’est normal ? 😉

 

Techdays 2014 : Les 11, 12 et 13 février

Cette année encore Microsoft nous invite tous au Palais des Congrès, Porte Maillot à Paris, à partir du mardi 11 février, pour les Techdays 2014, l’occasion de nous présenter tous ces jolis nouveaux produits : SQL Server 2014, Power BI, Office 365, Windows Azure…

Techdays2014_1

Comme d’habitude les inscriptions sont gratuites, et comme d’habitude ce sera l’occasion de croiser du beau monde !

Personnellement je vous recommande les sessions suivantes :

De mon côté je devrais trainer sur le stand ATE (Ask The Expert), j’imagine à côté de l’espace projets, pour répondre à toutes vos questions sur la BI Microsoft.

On se retrouve sur place ? Il ne reste plus qu’à vous inscrire 😉

Retour sur les JSS2012 – en tant que visiteur :)

Avant de vous faire un retour en mode speaker, avec comme promis les slides pour la Modélisation Dimensionnelle, je voulais faire un petit retour sur les sessions auxquelles j’avais assisté lors de cette édition 2012 des Journées SQL Server.

Parce que je ne sais pas comment vous vous l’avez vécu, mais moi j’ai constaté une vraie montée en puissance de certains speakers, tant en terme de contenu que de niveau de présence et de présentation. Ok, et en toute franchise, le niveau était loin d’être uniforme, et c’est un des sujets sur lequel on travaillera pour l’année prochaine. Mais pour moi, la présence des speakers suivant valait largement le déplacement (dans l’ordre chronologique des sessions) :

    Eric Grenon aux JSS2012

  • Eric Grenon sur le Private Cloud. Il connaît très bien son sujet et j’ai bien accroché avec ses idées. J’ai malheureusement du m’éclipser avant la fin pour des soucis d’organisation, mais définitivement une bonne découverte.

Aurélien Koppel aux JSS 2012

  • Aurélien Koppel sur SSAS Tabular. J’aime beaucoup son style un peu dandy, c’est bien préparé, ça déroule tout seul, on voit l’expérience !

Patrice Harel aux JSS2012

  • Patrice Harel, la révélation de ces JSS2012, pourtant sur un sujet assez aride : le Processing sur SSAS 2012. Comme pour son livre, on sent la maitrise et la passion pour les outils, bravo !

François Jehl et David Joubert aux JSS2012

  • Le duo François Jehl et David Joubert, sur la session DAX pour les fans de MDX. Là on avait le package complet : le fond et la forme, avec l’humour en prime. J’ai passé un excellent moment et vous l’aurez compris, c’est ma session préférée de cette édition.

Stéphane Guilleminot aux JSS2012

  • Enfin, Stéphane Guilleminot, qu’on a applaudit à la fin de son opération de chirurgie XML sur package SSIS 2012. Honnêtement je ne m’y serais pas risqué, mais lui il l’a réussie, en live.

Un gros bravo également aux speakers hors concours :

N’oublions pas ceux que je n’ai pas pu voir (3 à 4 tracks en parallèle, plus l’organisation, dur de tout suivre), je sais donc que j’en ai raté d’autres très bons 🙂

Et vous alors, qui ont été vos chouchous cette année ? Vous partagez mon avis sur le niveau qui s’améliore?

PS : Un gros bravo à la photographe, Annaelle Le Roy, car ces gens ne sont vraiment pas aussi beaux dans la vraie vie 😉

Modélisation Dimensionnelle : Les Fondements du Datawarehouse (webcast)

Comme promis précédemment, voici le webcast de la session que j’ai co-animé aux Journées SQL Server 2011: Modélisation Dimensionnelle – Le fondement du Datawarehouse. Pour info je suis le mec qui monopolise la parole pendant les premiers 3/4 d’heure (désolé Jean-Pierre!)

Le webcast est disponible juste là:

Webcast Journées SQL Server 2011 : Modélisation DimensionnelleModélisation Dimensionnelle – Webcast JSS 2011

Les slides sont disponibles en PDF et en PPTX. Pour la liste de tous les webcasts, c’est sur le site du GUSS.

Je vous mets ici les références citées de la session, par ordre chronologique:

Les liens vers les organisateurs:

  • Le GUSS : inscrivez vous, c’est gratuit!
  • Microsoft : les meilleurs produits bases de données et décisionnel du monde, oui madame! Vous y trouverez SQL Server 2012 en version RC0 (Release Candidate) en téléchargement libre 😉

Je rajoute la littérature obligatoire pour tout consultant décisionnel qui se respecte 😉

Si vous avez des remarques, des conseils, des corrections à faire, ou des questions à poser c’est le moment et l’endroit (PS : pour les clefs étrangères, c’est ici que ça se passe) 😉

Pour ou contre les clefs étrangères dans le datawarehouse?

Mise à jour 19/12/2012 – Un épilogue intéressant par Fred Brossard!

Durant notre session sur la Modélisation Dimensionnelle, avec Jean-Pierre nous n’avons pas pu nous empêcher de provoquer la foule (en délire :)) en lâchant l’air de rien un « …de toutes façons les foreign keys, en décisionnel, on ne les implémente pas... ». C’était évidemment une petite provocation, qui a bien fonctionné, mais il est temps de faire place aux arguments!

Le pour:

  • Implémentation au niveau du moteur SQL de la contrainte d’existence de la clef étrangère

Le contre:

  • Perte de performance à l’insertion (visible à partir de volumétries « importantes », naturellement dû à la vérification effective de la contrainte)
  • Perte de la commande TRUNCATE sur les tables concernées
  • Implémentation au niveau du moteur SQL de la contrainte d’existence de la clef étrangère

Hum… Il me semble voir un élément en double dans ma liste…

Pourquoi mettre la contrainte d’existence dans les contres? Parce qu’en mode projet, lors de la fabrication du datawarehouse, vous allez vider et remplir des centaines de fois vos tables de faits et vos tables de dimension. Et même très souvent, vous allez recharger vos dimensions sans vous soucier de vos faits. Implémenter à ce moment là vos clefs étrangères, c’est vous obliger à vider dans l’ordre les bonnes tables, sans utiliser un TRUNCATE, ou alors supprimer et recréer vos clefs à chaque fois… Encore du boulot alors qu’on en a déjà assez. C’est pourquoi à mon sens pendant le projet, les clefs étrangères ne sont qu’un frein à l’itération rapide sur le design.

La question devient alors: comment garantir la contrainte d’existence d’un membre de dimension pour un ID présent en table de fait? Pour moi cela doit être fait par design, au niveau de l’ETL:

  1. On dispose initialement d’un « Membre Inconnu« , sur une ID technique comme le -1, dans les dimensions
  2. On alimente ses dimensions à partir des fichiers sources, afin de capturer à la volée les nouveaux membres qui peuvent arriver
  3. Lors du chargement des tables de faits à partir de ces mêmes fichiers, on effectue un LOOKUP sur la table de dimension pour aller chercher l’ID du membre correspondant
    • Soit le membre existe : pas de problème
    • Soit le membre est inconnu : on indique en dur l’ID technique (-1), et on vérifie que la valeur a bien été rejeté lors du chargement de la dimension (sinon c’est qu’on a un vrai problème: pourquoi le membre n’apparaît pas dans la dimension?)

Avec ce petit algorithme, on ne peut pas insérer un NULL dans la table de faits. D’ailleurs, rien ne vous empêche de rendre les colonnes de clefs de dimension NOT NULL dans vos tables de faits. Évidemment, avec cette technique, les DELETE sont interdits dans la table de dimension, sinon rien ne vous protège d’avoir un ID en table de faits qui ne remonte pas sur la table de dimension.

Maintenant que j’ai dit tout ça, ne croyez pas que je sois anti clefs étrangères, bien au contraire. Si vous êtes dans un datawarehouse qui doit effectuer des DELETE sur ses dimensions (chargements exotiques, purge de la profondeur d’historique…), il est plus que conseillé d’utiliser les foreign keys. Et d’une manière plus générale si vous n’avez pas confiance dans votre ETL, appelez les consultants… euh non pardon, utilisez les foreign keys (et appeler aussi les consultants! :)).

Dans tous les cas, le débat est ouvert dans les commentaires, n’hésitez pas à donner votre avis et vos arguments sur le sujet, je suis à l’écoute!

PS : Il faut rendre à César ce qui appartient à César, et celui qui a fait mon éducation sur ce sujet c’est évidemment David Joubert, expert technique de génie 🙂

Piqûre de rappel : Journées SQL Server 2011

Je profite de 5 minutes de pause dans ma semaine trop chargée pour vous rappeler que dans 10 jours a lieu les Journées SQL Server. Je vous en ai déjà parlé, François Jehl et Jean-Pierre Riehl aussi, mais en court c’est 2 jours (ou 1h, selon votre disponibilité) où on va parler SQL Server 2012 et décisionnel (et d’autres sujets mais moins sexy pour nous :)), c’est gratuit et c’est sur le campus Microsoft à Issy-Les-Moulineaux.

C’est le moment de s’informer sur ce qui va se passer avec 2012, de rencontrer des professionnels et partager avec eux nos idées et points de vue sur le métier et les produits. C’est aussi le bon endroit pour rencontrer un futur employeur 😉

Moi j’y trainerai les 2 jours, n’hésitez pas à venir me voir pour discuter de ce que vous voulez (laissez moi un commentaire ici si vous ne savez pas à quoi je ressemble :)).

Les inscriptions sont toujours par ici!