Le bouquin SSIS 2012, par le trio gagnant Coutaud / Harel / Jehl

C’est avec un grand plaisir que j’ai reçu un exemplaire gracieux du livre SQL Server Integration Services 2012 – Mise en œuvre d’un projet ETL avec SSIS 2012, aux éditions ENI, écrit par les très respectables Patrice Harel, Romuald Coutaud, et François Jehl.

SSIS 2012 - Coutaud, Harel et Jehl - Editions ENI

Je dois encore me le faire dédicacer (perso je profiterai des JSS2012 pour le faire, n’hésitez pas à amener votre copie si vous voulez faire de même), mais ça ne m’a pas empêché de déjà le terminer !

En deux mots : c’est un très bon livre sur SSIS 2012, définitivement le meilleur écrit en français (le seul ? :p), et même sans cet avantage il n’a pas à rougir de son contenu face aux poids lourds américains.

A qui se destine ce livre :

  • Les développeurs, experts techniques et architectes en décisionnel Microsoft qui veulent se mettre à jour sur 2012. On se fait un chapitre tous les jours pendant 2 semaines et c’est réglé.
  • Les autodidactes qui veulent stabiliser leurs connaissances. On apprend le pourquoi des fonctionnalités et quels sont les cas d’usages classiques du produit (oui on fait tous de l’OLE-DB, pas la peine de souffrir à essayer de faire autre chose). Excellent quand on n’a pas accès à quelqu’un d’expérimenté qui peut répondre aux questions et transmettre les bonnes pratiques.
  • Les développeurs d’ETL non Microsoft, c’est une très bonne première approche pour cerner le produit. Je conseillerais même de lire le livre avant de toucher à SSIS, cela vous donnera une familiarité avec l’interface qui aidera grandement le transfert de compétences.
  • Les chefs de projet : c’est un bon point de référence pour participer aux discussions techniques avec vos développeurs. Il y a un choix d’implémentation à faire et vous voulez comprendre les tenants et aboutissants de la conversation ? Hop hop ouvrez la page correspondante du livre et vous comprendrez les enjeux (attention quand même à ne pas déraper ;))

Ce n’est pas pour :

  • J’aurai du mal à recommander le livre à un vrai débutant. Les auteurs nous préviennent d’ailleurs – le livre nécessite des compétences générales en base de données – j’irai plus loin, il nécessite d’avoir déjà été exposé un minimum au monde joyeux de l’ETL d’entreprise. Parce que si le niveau technique est progressif et bien structuré, ce n’est pas un tutoriel, et un débutant ne saurait pas par quel bout commencer s’il n’avait que ce bouquin sous la main.
  • De même pour un expert technique déjà sur 2012 depuis quelque temps, à qui ne peuvent s’adresser que les 3 derniers chapitres.

Rapide revue des chapitres :

  1. Introduction à SSIS : Un peu trop rapide à mon gout. Il manque l’historique du produit, de sa place dans la chaîne BI Microsoft, de son positionnement par rapport aux concurrents (forces et faiblesses)… Mais vous le savez, c’est ma marotte, j’aime avoir le contexte, connaître le pourquoi d’une situation, d’un produit, et ça s’applique même dans un bouquin sur SSIS 😉
  2. Flux de contrôle : Excellent chapitre, exhaustif et qui donne des éléments de contexte sur les fonctionnalités. Must read : la revue des connecteurs de base de données (ADO.NET, ODBC, OLE DB…) et le petit guide de quand employer lequel (p41).
  3. Variables, paramètres et expressions : Très bonne lecture, mais à mon sens il manque une petite explication du besoin fonctionnel avant le détail et l’exemple d’implémentation. On a les outils et la solution sans avoir le problème initial. Par ailleurs c’est un très bel exemple d’implémentation qui a été choisit, qui illustre bien le rôle de chacune des fonctionnalités. Must read : la liste des types de données des variables et leur correspondance en type de base de données (Double c’est DT_R8 ou DT_I8 ? réponse page 135 :)).
  4. Manipulation de données simples : Passage assez descriptif obligatoire mais pas vraiment passionnant pour un vieux de la vieille !
  5. Transformation de données : Une explication des composants de la boîte à outils de SSIS 2012. J’aime les petites remarques qui viennent rappeler les cas d’usages réels, leur emploi dans la vraie vie en somme, et pas uniquement les vœux de Microsoft. Quelques pages sur le CDC et DQS, c’est bon à prendre !
  6. Flux de données multi-source et jointures : Un bon comparatif des différentes solutions de brassage de flux de données dans le data flow. J’aime qu’on se détache un peu des composants pour penser flux de données. Must read : les petits schémas explicatifs des LEFT/RIGHT/INNER/FULL OUTER JOIN (p238), un petit test que d’ailleurs j’adore faire passer à mes développeurs juniors pour valider leur compréhension de la chose.
  7. Événements et suivi d’exécution : Le détail du gestionnaire d’événements (avec le bon conseil de modérer son utilisation), de la gestion des logs, du debug, du monitoring et de la nouveauté 2012 : les data taps. Des sujets pas forcément ultra-sexys mais présentés de manière très digeste.
  8. Administration SSIS : Chapitre qui débute avec un comparatif entre l’ancien mode de déploiement (granularité package) et le nouveau (granularité projet) qui cohabitent dans SSIS 2012. Je ne suis pas convaincu comme les auteurs que le nouveau mode doit être utilisé systématiquement. J’ai fait quelques projets Datastage (chut !) qui utilise largement la notion de repository, et j’aime beaucoup l’indépendance que fournit SSIS en mode déploiement de package (rien de tel que les déploiements en mode dépose de fichiers dtsx sur le disque du serveur, aucune équipe d’exploitation ne peut se planter). Je suis content que le choix reste possible dans 2012 et j’espère qu’il le restera dans le futur. Le reste du chapitre détaille bien les possibilités d’administration offertes par SSIS dans les 2 modes de déploiement.
  9. Checkpoints et transactions : Un très bon chapitre sur une fonctionnalité à oublier de SSIS, c’est un peu du gâchis ! En tout cas respect aux auteurs d’avoir pris le temps de traiter le champ de mines qu’est la configuration des checkpoints. Pour les transactions je dirais que soit elles sont traitées trop rapidement, soit elles ne sont pas assez creusées. Mais je ne peux pas leur en vouloir : c’est un sujet délicat qui justifierait à lui seul plusieurs chapitres et qui n’est finalement que très rarement employé.
  10. Notions avancées et bonnes pratiques : Un chapitre définitivement trop court ! Je comprends que les auteurs ne veulent pas nous révéler tous leurs secrets, mais j’en aurais voulu plus 😉 Par exemple quelques implémentations des scénarios classiques dans SSIS : la détection de doublons, le nettoyage d’un champ texte, la conversion d’une date, le chargement d’une table de fait, la gestion d’une table de transcodage…
  11. Programmation de composants SSIS : J’avoue avoir parcouru le chapitre en diagonale, mais j’y ai trouvé ce qui me semble être un très bon tutoriel pour le développement de son premier composant perso, partant des méandres des éléments à installer sur son poste et les serveurs jusqu’à l’ajout d’une interface graphique pour le paramétrage à l’utilisation. Beau boulot !

A mon sens il manque, dans le désordre :

  • Le load balancing de packages sur une ferme de serveurs SSIS, et plus globalement un petit chapitre sur le déploiement de SSIS sur des grosses infrastructures
  • La gestion des comptes de service et l‘héritage des droits à l’exécution (oui je te regarde SQL Agent)
  • Des recommandations / abaques sur les performances attendues en fonction de volumétries classiques sur 2/3 configurations matérielles standard. Histoire de savoir si on est dans les clous ou à côté de la plaque en traitant 5 millions de lignes de 20 colonnes de texte en 10 minutes sur un quad-core avec 16Go de RAM et un disque 7200tpm. Très grosse maille évidemment.
  • Une vision un peu plus architecture et un peu moins produit. Gérer sa solution et ses projets, l’atomicité d’un package et d’un data flow, l’enchainement des packages (children ou par SQL Agent)…
  • Le détail de l’accès aux features en fonction des éditions (standard, BI, entreprise)
  • Une petite conclusion sur le futur de SSIS dans le cloud azuré?

Évidemment le bouquin fait déjà 450 pages, alors à un moment il faut savoir tailler pour sauver les arbres 😀

En conclusion :

Je recommande sans problème. Beau travail messieurs, merci pour votre dur labeur, à quand le prochain sur SSAS ? 🙂

4 liens pour la semaine (2012-47)

Ça faisait trop longtemps!

  1. Via Daring Fireball, une vision rationnelle sur le scandale Petraeus (le patron de la CIA qui avait une maîtresse trop bavarde) et plus globalement sur le devoir d’exemplarité de nos dirigeants. La deuxième partie a remis en question mon avis sur le sujet.
  2. David Heinemeier Hansson de 37 Signals sur les libertés d’entreprendre exceptionnelles dont nous jouissons aujourd’hui, et les dangers qui les menacent.
  3. Via Jason Kottke, la véritable histoire du Monopoly. C’est un peu long, mais beaucoup moins capitaliste qu’il n’y parait…
  4. Enfin, via BoingBoing, une nouvelle perspective sur l’expérience de Milgram. J’aime beaucoup ce sujet d’étude en psychologie car c’est une version certes extrême, mais finalement assez proche, de la vie de bureau.

______________________

<< Semaine Précédente – Semaine Suivante >>

Dilbert du 04/09/2012

Rien de tel que tout faire soi-même. De cette manière à la fin on sait tout faire. De quoi le planning?

Traduction approximative:

Boss: Je n’ai plus de budget pour le logiciel de monitoring réseau dont vous avez besoin. Vous allez devoir le coder vous-même.

Dilbert: Bonne idée. Je reviens vers vous dès que c’est fait…

Dilbert: A quoi ressemble votre calendrier en 2040?

Boss: Une grille avec des cases vides.

Petit guide pour bien naviguer lors des événements de la communauté

Ho le vl’a qui radote encore sur la communauté!

Hé oui! Quatre articles sur le sujet en deux semaines, il faut croire que ça me tient à cœur 😉

Si vous vous interrogez à venir à un afterwork ou à une conférence, que vous ne savez pas quoi faire lors de ces réunions, quoi dire, comment rompre la glace, alors vous êtes bien tombés !

Parce que ces questions peuvent sembler stupides, mais ce n’est pas toujours évident de savoir créer des rencontres lors de ces événements très artificiels. En effet la rencontre d’une dizaine de personnes qui ne se connaissent souvent même pas de vue, c’est assez étrange. D’autant plus pour nous autres informaticiens, dont les aptitudes sociales ne sont pas toujours le point fort…

Déjà rassurez-vous : ces drôles de rencontres sonnent faux et artificiel pour tout le monde. A part peut-être pour JP, qui a définitivement ça dans le sang, sinon les premières fois vous allez certainement vous demander ce que vous faites là. Et c’est une très bonne question à se poser : qu’êtes-vous venu chercher à cet événement ?

Car si j’encourage les sociétés à s’interroger sur pourquoi elles font les choses, je crois sincèrement que c’est une démarche qui s’applique également au niveau personnel. C’est de là que vous tirerez la motivation nécessaire pour appréhender ce type d’événement, avant que vous ne veniez simplement pour le plaisir de retrouver les copains que vous vous serez fait (mon cas désormais).

Venir à un afterwork, participer à une conférence comme les JSS2012, c’est faire un choix actif dans sa carrière, tout comme s’abonner à une newsletter technique ou à un blog, ou encore acheter et lire un livre traitant de son métier. A mon sens, dans un monde où la plupart se suffisent du minimum, ce sont des actes forts qui montrent une volonté de prendre sa carrière en main. Alors ok ce sont de petites étapes, mais ce sont les premières et elles sont incontournables.

Maintenant pourquoi vous voulez prendre votre carrière en main ? Il n’y a que vous pour répondre à cette question. Mais je ne peux que vous féliciter de ce choix !

Ça c’était la théorie. Pour la pratique, les choses sont simples :

  • Je l’ai déjà dit, oui tout ça sonne faux, artificiel, et oui tout le monde le ressent. Donc on peut ignorer le sentiment et passer à autre chose 😉
  • Il n’y a aucun problème à ce que vous restiez dans un coin à observer pour les premières fois, histoire de sentir la température et vous habituer à la chose. Mais ça ne doit pas devenir une habitude (confère vos objectifs)
  • S’il y a des tours de table de présentation, pas de honte à juste bredouiller rapidement son prénom, son poste et sa société. Certains n’aiment pas prendre la parole en public, les organisateurs le savent, et passeront vite la parole au suivant s’ils sentent un malaise.
  • Vous pouvez facilement entamer la conversation avec n’importe qui en utilisant la méthode de Jen Stirrup :
    • Si ce n’est pas déjà fait, vous vous présentez rapidement : « Bonsoir moi c’est David. Je suis Animateur Décisionnel chez Itecor, et vous ? »
    • Vous pouvez échanger sur vos technologies de prédilection dans la stack BI : « Moi je suis un fan de SSIS, l’alimentation c’est pour les garçons ! Et vous ? »
    • Vous pouvez interroger la personne sur son parcours, pourquoi la BI, pourquoi Microsoft, pourquoi ce poste ? « Animateur décisionnel ? Vous ne connaissez pas ? Je vais vous expliquer… »
    • Et je rajoute : vous pouvez évoquer vos projets actuels (techniquement parlant, notez qu’il y a toujours un petit tabou sur le nom des clients), ainsi que vos dernières difficultés techniques, et là je suis sûr qu’il y a matière à tenir 3 ans de conversation avec ça 😉

Si malgré tout ça vous vous sentez mal à l’aise, qu’il y a des gros creux de conversations, ou des sous-groupes qui ricanent dans leur coin, c’est que les organisateurs se sont plantés. Perso je ne leur jetterai pas la pierre, organiser ce genre d’événement n’est pas évident. Donc laissez leur une deuxième chance, et si les mêmes choses se reproduisent, c’est en effet qu’il faut changer de groupe… Sauf si ça vous arrive à un afterwork du GUSS, là vous avez le droit de nous faire un retour sanglant, histoire qu’on s’améliore 🙂

Venez rencontrer la communauté SQL Server ce jeudi!

Le GUSS et l’équipe organisatrice des JSS2012 – Journées SQL Server 2012, se retrouve jeudi soir (ce jeudi, le 15/11/2012) autour d’un verre.

Venez nous rejoindre pour :

C’est comme d’habitude au Charly Birdy du 15ème (1 place Etienne Perret à Paris), on s’y retrouve à partir de 19h00, en général au premier étage.

Si vous nous cherchez dans la foule, y’a pas mal de nos trombines par là.

A Jeudi 🙂

Journées SQL Server 2012 : Inscriptions ouvertes :)

Nous voilà repartis pour un tour, en effet il est temps d’annoncer l’ouverture des inscriptions aux JSS2012 🙂

Vous vous souvenez de cette conférence? Mais si, j’étais speaker l’année derrière (maintenant aussi sur Youtube!), et cette année j’y retourne en speaker et membre du staff. Autant vous dire qu’on fait une belle bande de canards à l’air très calme, mais qui pédalent furieusement sous la ligne de flottaison !

Alors vous vous demandez peut-être quelle conférence choisir, au moment où Microsoft annonce la prochaine édition des Techdays en février 2013? Très clairement, si vous pouvez assister aux deux, n’hésitez pas. Mais pour faire la distinction, aux JSS2012, organisées par le GUSS, vous allez apprendre. Aux Techdays, organisées par Microsoft, vous allez découvrir. Si je peux me permettre une boutade, envoyez vos managers aux Techdays, et venez vous-même aux Journées SQL Server !

N’hésitez donc pas à vous inscrire aux JSS2012, c’est gratuit, y’aura du beau monde, en « petit » comité (autour de 400 personnes prévues), avec du contenu de qualité! N’attendez pas 😉