4 liens pour la semaine (2013-02)

Que du très bon pour bien commencer l’année!

  1. David HH de 37 Signals sur son œuvre, et la réalisation qu’il travaille désormais pour une entreprise dans laquelle il pourrait rester jusqu’à la retraite. Bon point de départ pour une petite introspection en ce début d’année!
  2. Brennan Dunn qui nous explique pourquoi il a sorti sa boîte du consulting pour passer côté éditeur. C’est un point de stratégie qui revient régulièrement lors des comités de direction en SSII.
  3. Bryan Goldberg avec un excellent article pour les plus jeunes d’entre nous. Pessimiste ou réaliste? A mon sens clairvoyant. A recommander à tous les étudiants qui se cherchent.
  4. Stephen Few qui nous propose le mouvement Slow Data, image de la réaction Slow Food VS Fast Food mais pour le monde de l’information. J’adhère définitivement. C’est un must read par tous les décideurs IT!

______________________

<< Semaine Précédente – Semaine Suivante >>

Big Data, Révolution IT ou effet de mode marketing ?

Je reviens sur le sujet Big Data en quelques schémas faits rapidement sur ArgumentPuissant. Ils sont inspirés par Stephen Few, Ralph Kimball, Rob Collie, Jen Stirrup, Romuald Coutaud, et plein d’autres…

Si on part de la pyramide du savoir, que vous connaissez tous (data > information > knowledge > wisdom en VO) :

Data > Information > Connaissance > Sagesse

Et qu’on écoute les services marketing des éditeurs, et les analystes, le Big Data ça donne ça :

Data > BOUM Big Data > Sagesse

Par contre si on écoute son bon sens, et les gens dont je parlais plus haut, ça donne plutôt ça :

Big Data > Data > Information > Connaissance > Sagesse

A vous de choisir la vision de la chose qui vous semble la plus réaliste.

Le Big Data c’est une belle nouvelle technologie, qui en effet va nous permettre de réaliser beaucoup de nouvelles analyses vraiment chouettes. Mais seulement à travers les outils dont on dispose déjà : les bases relationnelles (le SQL), la modélisation dimensionnelle (dimensions et mesures), la visualisation de données, et une méthode scientifique, une approche rationnelle de compréhension du monde qui nous entoure. Ces étapes ne sont pas facultatives, le Big Data n’y change rien.

Si dans votre entreprise vous n’arrivez déjà pas à exploiter pleinement votre plateforme décisionnelle, à passer de l’information à la connaissance, alors ne vous engagez pas dans un projet Big Data. Plus de données, plus d’informations, ne vous aideront certainement pas à y voir plus clair.

Je reviendrai sur cette pyramide du savoir. C’est une représentation que j’aime beaucoup, et qui illustre bien les différentes facettes de notre métier. On en reparle plus tard 😉

En décisionnel aussi il faut suivre la mode!

Le petit monde de la data n’est pas étranger aux phénomènes de mode. Si je vous demande quels sont les sujets du jour, je suis quasi sûr que tout le monde me répondra Big Data et Data Visualization. Et ceux de l’année dernière ? Plutôt Cloud et BI Self-Service. Avant cela ? C’était BI Agile et le InMemory

Aujourd’hui j’aimerais faire un point rapide sur les caractéristiques et les mérites de certains de ces buzzwords, et l’impact qu’ils ont eu sur mon métier de consultant décisionnel. Evidemment ce sont des raccourcis, si vous êtes expert d’un des sujets, n’hésitez pas à nous en dire plus dans les commentaires 🙂

Data Visualization

  • C’est quoi : Une volonté artistique dans un monde de tableurs
  • Pourquoi : Rendre attractive la consommation de la donnée. Permettre aux utilisateurs d’utiliser autre chose que des feuilles Excel pour voir et comprendre les données
  • Dans mon quotidien : La dataviz pure nous vient du monde des designers. La partie visuelle est magnifique, mais la partie data est souvent négligée (analyses non reproductibles, traitement de la qualité des données aléatoire…). C’est beau, certes, mais difficilement transposable en entreprise. Cependant ce courant a déclenché une reconnaissance, a identifié un besoin qui pousse l’adoption de vrais produits technologiques (dont Tableau) qui permettent de faire du beau et du solide. Et ça c’est vraiment mon quotidien !
  • Si ça vous intéresse : je vous encourage à assister aux Data Tuesdays. Entre les présentations des dernières visualisations et la faune toute particulière, c’est une expérience à vivre 😉

Big Data

  • C’est quoi : Un courant technologique, une nouvelle sorte de base de données
  • Pourquoi : Répondre à un besoin spécifique : les 3 V – Vitesse (quasi temps réel), Volume (>TB) et Variété (des types et thèmes de données). Si les bases de données « legacy » (SQL Server, Oracle, MySQL, Teradata…) répondent bien à chaque combinaison de 2 V parmi les 3, il fallait autre chose pour traiter les 3 en même temps.
  • Dans mon quotidien : Ca frémit gentiment, les clients nous demandent des infos sur la techno, ça fait partie de la veille technologique, mais pas encore de business à proprement parler. Par contre je le vois arriver dans mes produits, que ce soit Tableau ou SSIS (via Azure), dans lesquels j’ai à disposition des connecteurs vers Big Data (Hadoop/Hive). Il me faudrait les tester pour voir les contraintes, c’est dans ma to-do list mais pas en haute priorité…
  • Si ça vous intéresse : Le mieux c’est surement d’implémenter la chose. Bon courage, et faites-nous un retour 🙂

Le Cloud (version BI)

  • C’est quoi : Un courant technologique, l’hébergement des services informatiques (base de données entre autres) « sur Internet ».
  • Pourquoi : Les services ainsi hébergés sont disponibles à tous vos utilisateurs à travers une simple connexion Internet. L’infrastructure est complétement virtuelle, elle est gérée par l’hébergeur, les SLA sont censés être garantis et le tout peut évoluer en 3 clics de souris.
  • Dans mon quotidien : Une avalanche de mail de Microsoft pour me convaincre d’utiliser SQL Azure et des private jokes sur la tarification de la chose sur les « SELECT * ». Plus sérieusement, je vous avoue que je suis encore partagé sur le cloud. Côté points positifs, les cas d’utilisation que ce type de techno libère pour le reporting sont excellents. Il n’y a qu’à voir les nouvelles solutions hébergées de dashboarding qui apparaissent, c’est vraiment chouette (oui je vous dois un comparatif, c’est dans les tuyaux !). Côté points négatifs, j’ai encore des réticences à imaginer héberger un datawarehouse dans la durée dans le cloud. D’abord parce que les performances ne sont pas encore là (ETL bridé par la bande passante par exemple), ensuite parce qu’à mon sens le stockage des données d’entreprise doit rester dans l’entreprise.
  • Si ça vous intéresse : Essayez SQL Azure, malgré toutes mes réticences sur le concept ça reste un outil technologique bluffant.

Le In Memory, le stockage vertical, les algorithmes de compression du futur…

  • C’est quoi : Des nouvelles techniques pour les bases de données
  • Pourquoi : Enfin tirer parti des nouvelles architectures physiques des machines modernes (beaucoup de RAM, CPU multi core…)
  • Dans mon quotidien : C’est partout. Que ce soit Tableau (on ne connait pas exactement les optimisations du moteur de Tableau mais c’est bien dans la même veine) ou la BI Microsoft (xVelocity alias Vertipaq qui est le moteur derrière PowerPivot et SSAS Tabular), ça a été intégré dans mes produits et je l’utilise donc régulièrement. En fait c’est totalement transparent pour nous, en dehors de quelques contraintes de design, c’est juste que les bases sont beaucoup plus rapides sur des opérations historiquement délicates (distinct count…).
  • Si ça vous intéresse : Si vous êtes dans le décisionnel il y a de fortes chances que vous l’utilisiez déjà. En effet en plus de Tableau et Microsoft, la plupart des éditeurs ont déjà intégré ces nouvelles sauces à leurs produits : SAP HANA, le moteur de QlikView, IBM TM1, Oracle en mode appliance, Tibco Spotfire…

Je conclue ce petit tour d’horizon en vous rappelant que la BI Agile j’en ai déjà assez parlé dernièrement et en vous annonçant que la BI Self-Service c’est mon nouveau sujet chouchou ! De ce sujet on en avait déjà causé sur FrenchConnection.bi et j’y consacrerai un autre article bientôt.