Retour de Stephen Few sur l’étude Forrester sur la visualisation de données avancée

Stephen Few est mon nouveau gourou. Tout du moins dans la partie Business Intelligence (décisionnel) de mon activité.

J’ai acheté ses livres et je suis en train de les dévorer. Un compte rendu arrive bientôt, mais à mon sens « Show Me The Numbers » (édition 2012) représente côté visualisation de données ce qu’est « The Datawarehouse Toolkit » (2nd édition) de Kimball côté entrepôt de données. Et ceux qui me connaissent savent à quel point je vénère ce livre, donc ce n’est pas peu dire !

Show Me The Numers : Pareto Chart

D’ailleurs si vous vous souvenez c’est déjà Stephen Few qui m’avait inspiré pour cet article, c’est lui l’auteur du slide, et je suis content puisque désormais j’ai une bible pour chaque côté de la barrière.

Pourquoi vous en reparler maintenant ? Parce que ce bon monsieur a un blog, qu’il a du caractère et qu’il n’a pas sa langue dans sa poche. Donc naturellement il allume joyeusement et régulièrement l’industrie décisionnelle au sens large, et c’est plutôt jouissif.

La dernière en date je n’allais pas spécialement vous la rapporter, mais Stéphane Nardin a bien fait d’insister et j’y suis retourné pour voir que non seulement l’article de Mister Few est bon, mais que les commentaires qui suivent sont excellents.

Je crois que l’ensemble vaut vraiment les 10 minutes de lecture qu’il requiert, mais pour les pressés et les anglophobes je vous la fais en courte :

  • Stephen Few raconte dans l’article comment à la simple lecture de l’extrait gratuit du dernier rapport de Forrester sur la visualisation de données (2500$), il sait que c’est du vent. Morceaux choisis :
    • « … parce que, basé sur ses précédentes publications, je sais que Boris Evelson (un des deux auteurs) ne comprends pas grand-chose à la visualisation de données… »
    • « Personne avec un minimum d’expertise dans la domaine de la visualisation de données ne placerait IBM, Information Builders, SAP et Oracle dans la liste des leaders à côté de Tableau Software, Tibco Spotfire et SAS… »
    • « L’équipe de Forrester fait preuve de ce comportement typique dans le monde de la BI de l’obsession sur la technologie plutôt que sur les compétences et activités qui permettent de réaliser des visualisations efficaces… »
    • « Si vous avez payé pour le rapport de Forrester, demandez à être remboursé. Rappelez-leur qu’avec un tel prix, vient l’attente d’un niveau réel d’expertise. »
  • Dans les commentaires il continue :
    • « Vous pouvez penser que c’est violent de qualifier le rapport de Forrester de mensonges. Peut-être est-ce seulement de l’ignorance. Mais quand on prétend être expert, on se donne la responsabilité de connaître la vérité. Les auteurs ne peuvent pas être omniscients, d’accord, mais ils n’ont pas d’excuse pour ne pas connaître des faits aussi élémentaires ».
    • « Les auteurs de ce rapport, en fait, n’ont aucune expérience en visualisation de données. Ce sont des généralistes de la BI qui n’ont pas pris le temps d’apprendre ce domaine. »
  • Toujours dans les commentaires, il publie une mise à jour après avoir mis la main sur le rapport complet :
    • « Grace à un collègue qui m’a transmis une copie complète du rapport de Forrester, je peux maintenant dire que c’est pire que ce que j’imaginais. »
    • « Si cette étude représente la valeur générale qu’apporte Forrester à ses clients, ces derniers feraient mieux d’arrêter de payer et demander à être remboursés ».
  • Ce sur quoi intervient un certain Kyle McNabb, VP chez Forrester, qui tente de corriger le tir :
    • « Aucun vendeur ne paye pour apparaître dans l’étude » (en réponse à Stephen qui s’interroge sur pourquoi certains vendeurs qui n’ont rien à faire dans la visualisation de données y apparaissent quand même).
    • « Nos recherches sont exhaustives (…) Elles sont construites avec objectivité et en transparence ».
  • Et Stephen se lâche en réponse:
    • « C’était peut-être fatiguant (jeu de mot sur exhausting / exhaustive) pour vos analystes de compiler cette étude à cause de leur ignorance sur le sujet, mais ce rapport est loin d’être exhaustif ».
    • « Forrester produit peut-être des rapports utiles sur d’autres technologies, mais honte sur vous de produire un tel torchon sur la visualisation de données et de le facturer 2500$. »

Ouch.

Mais c’est aussi dans cette réponse finale qu’on touche à mon avis au coeur du problème. Stephen Few y révèle que l’un des auteurs lui a confié qu’il manquait d’expertise sur le sujet, et qu’il souhaitait que Stephen le forme. Seulement Forrester ne paye pas pour ce genre de prestation. Ils fonctionnent sous forme d’échange de bons procédés : la formation est gratuite, et en échange l’organisme cite l’auteur dans ses études, contribuant à sa notoriété, et oriente ses propres clients à la recherche de conseil vers la société de Stephen Few. Comme ce dernier le souligne, ce n’est pas avec ce genre d’arrangement qu’on peut garantir objectivité et transparence

Conclusion : ce n’est qu’un secret de polichinelle, mais les analystes (Forrester, Gartner…) disent un tas de choses qu’il faut savoir prendre avec des grosses pincettes. Personnellement, même quand je suis d’accord avec ce qu’ils publient, je place toujours un disclaimer qui rappelle la qualité incertaine de la source d’information. N’hésitez pas à faire de même !

4 liens rapides pour la semaine (2012-31)

Pas mal de très bons articles en ce moment, le choix a été difficile!

  1. L’excellente lettre du CEO de BuzzFeed qui explique le positionnement de sa start-up, relayée par Chris Dixon, via Jason Kottke. La lecture stratégie de la semaine.
  2. Par Hunter Walk: recruter sans entretien. Je suis vraiment partisan de cette nouvelle manière de penser: l’entretien n’est pas l’examen unique et ultime du recrutement, ce n’est que l’étape intermédiaire entre tester rapidement les candidatures pour éviter de perdre son temps (le manque de confiance qu’on peut avoir aujourd’hui dans les CV me désole, surtout au niveau des SSII) et travailler ensemble, avec le futur collaborateur/consultant, sur un vrai sujet, pour appréhender sa vraie valeur.
  3. Dan Ariely sur l’hypocrisie morale qui accompagne le pouvoir. Attention à ne pas tomber dans le piège soi-même! Un beau contre exemple en passant: l’humilité de l’avocat de Jack Daniels pour faire respecter son trademark.
  4. Enfin, Dan Wineman qui se lache sur VMware. Et il arrive à caser la pyramide de Maslow dans sa diatribe. Respect 😉

______________________

<< Semaine Précédente – Semaine Suivante >>

Rapide revue de Tibco Spotfire face à Tableau

Je vous l’ai déjà dit, je travaille sur un petit comparatif des différentes solutions de BI self-service qui existent sur le marché. Aujourd’hui j’avais une heure ou deux à tuer, et j’en ai profité pour essayer un des produits sur ma liste : Tibco Spotfire.

Je vais donc sur leur site web, je scanne rapidement pour trouver le lien de téléchargement, fastoche : il est en haut et en rouge.

Tibco Spotfire 1 - Download

J’arrive sur place et je trouve rapidement ce que je cherche : le lien « Download Now« . Hop, c’est cliqué.

Nouvelle page et premier lézard : on me demande de choisir une version, avec pour seul facteur différenciant le prix de la licence. Si on me laisse le choix vous vous doutez bien que je prendrai la moins chère… Mais je suis en mode comparatif, donc je clique sur le petit lien qui liste les différences entre les produits. Bien m’en a pris : il me faudra au moins les versions à plus de 1000$ par an pour s’alimenter sur autre chose que des fichiers Excel/Access. Vu que je veux tout voir, je vais tenter la version à 4500$ par an, qui comprend toutes les visualisations possibles.

Première remarque, point de vue tarif, c’est plus cher que Tableau (2000$ pour Desktop, 1000$ pour Server pour la première année, avec une maintenance à 20% par an après ça)

Et là je tilte : je ne suis plus sur spotfire.tibco.com, mais sur silverspotfire.tibco.com, la solution d’analyse sur le cloud de Tibco. Ceci explique surement qu’on me montre des prix récurrents annuels plutôt que des prix d’achats de licence + maintenance. Enfin peut-être… Parce qu’en fait je ne comprends plus si Spotfire est un client lourd ou pas. Continuons, on verra bien !

Je finis le processus de téléchargement : je me crée un compte, on m’envoie un mail, je télécharge un client, et hop, voilà l’icône sur mon bureau (non je ne fais pas de placement produit, non non)

Tibco Spotfire - 2 - Mon bureau

Je clic clic sur la jolie icone et une invitation apparaît :

Tibco Spotfire - 3 - Ecran de login

Hum… Si c’est vraiment un client lourd, il m’a l’air bien connecté au serveur… Mon problème ? Je n’ai pas vu passer une installation serveur sur mon poste (50Mb l’installeur + aucune demande de paramétrage serveur dans les next/next). Donc je choisis quoi comme serveur ?

Je retourne voir le mail de téléchargement pour voir si ça cause serveur… nop.

Je clic sur help, mais partout il est sous-entendu que je dispose déjà d’une URL vers un serveur. Bon, direction le site web où je trouve assez facilement l’accueil du support :

Tibco Spotfire - 4 - Support

Je confirme, la version « analyst » c’est bien ma version. Pas de chance avec les 2 « support guides » en lien, c’est les modes d’emploi de comment s’enregistrer pour ouvrir un ticket – je refuse de croire qu’il va me falloir ouvrir un ticket pour utiliser la démo gratuite du produit. Je dois avoir raté quelque chose !

Donc je continue à parcourir la page et je tombe sur une FAQ, qui elle répond à ma question dès les premières lignes :

Tibco Spotfire - 5 - FAQ de support

A ce moment-là je m’interroge : si l’URL du serveur public est fixe, ça aurait peut-être été pas mal de la mettre en dur dans l’installeur ? Mais je diverge.

Retour vers la fenêtre d’invitation, où je vais « manager mon serveur » :

Tibco Spotfire - 6 - Ecran de gestion des serveurs

Production ou test ? Je ne sais pas de quoi il s’agit. Alors je choisis Production, je suis comme ça moi !

Je saisis mon login / mot de passe :

Tibco Spotfire - 7 - Ecran de login complété

Et hop ! Enfin non, pas hop, mon client n’est plus à jour (je l’ai téléchargé il y’a 5 minutes pourtant). Donc c’est parti pour une mise à jour… qui durera en tout et pour tout moins d’1 minute. Ok je commence à être mauvaise langue, restons serein 😉

Voilà ! La bête est installée, on va pouvoir jouer ! Pourquoi vous avoir détaillé ainsi mon parcours ? Parce que je trouve que c’est dans ce genre de détails qu’on voit l’attention d’un éditeur à ses clients. Et là pour moi cette première impression n’est pas la bonne.

 Tibco Spotfire - 8 - Enfin l'écran d'accueil!

Pour ce qui est de l’outil en lui-même, je vous encourage à prendre 5 minutes pour regarder la vidéo de prise en main. Elle est rapide et bien faite. Dommage qu’elle ne soit pas mise en avant plus tôt, elle présente vraiment bien le produit et met en valeur ses avantages.

Voici à quoi ressemble Spotfire une fois qu’on a construit un tableau de bord (celui là est de démo – cliquez dessus pour voir en grand):

Tibco Spotfire - 9 - Interface complète

Mon avis, forcément biaisé (rappel, je suis responsable d’offre pour un produit concurrent dans une société de conseil) :

  • Interface
    • Globalement l’interface est plus simple que Tableau Desktop, voir même simpliste maintenant que je suis habitué à celle de Tableau. J’ai peur qu’en utilisation lourde on soit vite fatigué par l’aspect non-explicite des différentes options. Tableau fait vraiment application solide et robuste. Spotfire me donne l’impression contraire.
    • Cette impression vient surement du fait qu’avec Tableau Desktop on travaille sur un seul graphique à la fois et qu’ensuite on utilise ces graphiques comme des briques de légo pour construire un dashboard complet. Le fait de dissocier ces 2 activités permet d’optimiser les interfaces pour chacune des taches. Une fois les dashboards prêts on peut les publier sur Tableau Server, qui offre alors un troisième cas d’utilisation: accéder aux rapports dans un browser. Dans Spotfire on a l’impression de tout faire dans un seul écran, et forcément ça complique les choses. Explorer ses données, construire un tableau de bord et le consommer sont des activités différentes qui à mon sens doivent disposer d’interfaces différentes. Mais ça n’engage que moi!
    • Un vrai truc sympa : les graphes évoluent en live quand on joue avec les filtres. Ainsi on voit des portions disparaîtrent ou apparaîtrent et on comprend le passage d’un état à l’autre. Ça manque à Tableau et ça renvoie à la présentation de Jean-Daniel FEKETE, chercheur en dataviz à l’INRIA, lors du dernier Visual Decision Forum sur les bonnes pratiques en la matière.
  • Visualisations
    • Des vraies treemaps ! (j’ai pas sur Tableau, ça me manque)
    • Des sparklines directement en drag and drop, chouette !
    • Sinon la plupart des représentations classiques est bien présente et les couleurs par défaut sont bien choisies (comme Tableau)
  • Aspect technique
    • Côté sources de données : Excel, Access, CSV d’un côté. Connecteurs Oracle, ODBC, OLE DB en mode saisie de la chaîne de connexion de l’autre. Mouais, bof bof quand on voit la liste côté Tableau.
    • Pour les performances, je n’ai pas pu tester la chose sur du vrai volume, mais je n’ai encore jamais vu de retour négatif sur le sujet
  • Licences
    • A confirmer, mais si effectivement les licences de Spotfire ne sont pas des licences d’achat mais des licences d’utilisation annuelles, l’écart de facture avec Tableau est vraiment important et se creuse avec chaque année qui passe.
  • Positionnement du produit
    • Pour un avis plus neutre que le mien, voir la série d’article d’Andrew Pandre, surtout celui-là, en faisant attention aux dates et aux numéros de version des produits. Ça bouge très vite sur ces outils et les comparatifs sont vites dépassés.
    • De mon côté, je trouve que Tableau Desktop est un produit plus individualiste que Spotfire, ce qui est un bon point pour de la BI Self Service. Car en effet si Tableau Desktop peut fonctionner en total autonomie côté utilisateur, SpotFire nécessite une infrastructure et donc l’intervention de l’IT. Par contre une fois cette structure déployée, je pense qu’on peut ouvrir le client Spotfire à une population d’utilisateur qui pourrait avoir peur de Tableau Desktop. Oui, ok, je parle des analystes qui ont peur des tableaux croisés dynamiques dans Excel, mais ce sont des utilisateurs quand même !
    • Enfin, et histoire d’être complet, je vous pointe vers un comparatif qui lui est biaisé en faveur de Spotfire. Pensez quand même à lire sur Linkedin le contre argumentaire par les utilisateurs de Tableau, l’auteur du comparatif s’étant trompé sur quelques points concernant Tableau.

En conclusion je dirais que Spotfire me semble être un bon produit. Il est propre, carré, mais je dois dire que sa philosophie ne correspond pas à la mienne. Je veux un produit transparent et simple, certes, mais qui permet également de monter en puissance quand on en a besoin. Je veux également un produit qui peut fonctionner en totale autonomie, sans support de l’IT, et qui sait aussi s’intégrer si besoin. Tableau répond à ces deux critères à travers la dissociation de Tableau Desktop – un vrai client lourd d’exploration de données – et Tableau Server – le portail de diffusion – à mon sens Spotfire non (SilverSpotfire tout du moins).

4 liens rapides pour la semaine (2012-28)

J’enchaine 🙂

  1. Un très bon article de Vanity Fair sur la culture d’entreprise qui a fait perdre ses 10 ans d’avance technologique à Microsoft. A illuster avec ces graphiques d’Asymco.
  2. Une excellente idée d’un des derniers prix Nobel d’économie : mettre les banquiers en prison! Judicieux quand on voit ce que donne le pouvoir sans responsabilité.
  3. Une petite citation rapide de Steve Jobs. Ça fait pas de mal.
  4. Un article intéressant de DHH (corrigé @14h19) de 37 Signals. Il parle des niveaux d’inspiration lorsqu’on travaille sur une solution technique. Son message: il faut que tous les acteurs autour de la table soient au même niveau d’attente, qu’ils aspirent tous au même résultat, pour que le tout fonctionne. Je reprends son dessin ci-dessous:

C’est définitivement un axe d’analyse intéressant pour classer ses différentes équipes projet, autant en terme de compétence (le niveau maximal qu’elles sont capables d’atteindre) que d’investissement à l’instant t (le niveau auquel elles opèrent sur chacun de leurs projets en cours)!

______________________

<< Semaine Précédente – Semaine Suivante >>

En décisionnel aussi il faut suivre la mode!

Le petit monde de la data n’est pas étranger aux phénomènes de mode. Si je vous demande quels sont les sujets du jour, je suis quasi sûr que tout le monde me répondra Big Data et Data Visualization. Et ceux de l’année dernière ? Plutôt Cloud et BI Self-Service. Avant cela ? C’était BI Agile et le InMemory

Aujourd’hui j’aimerais faire un point rapide sur les caractéristiques et les mérites de certains de ces buzzwords, et l’impact qu’ils ont eu sur mon métier de consultant décisionnel. Evidemment ce sont des raccourcis, si vous êtes expert d’un des sujets, n’hésitez pas à nous en dire plus dans les commentaires 🙂

Data Visualization

  • C’est quoi : Une volonté artistique dans un monde de tableurs
  • Pourquoi : Rendre attractive la consommation de la donnée. Permettre aux utilisateurs d’utiliser autre chose que des feuilles Excel pour voir et comprendre les données
  • Dans mon quotidien : La dataviz pure nous vient du monde des designers. La partie visuelle est magnifique, mais la partie data est souvent négligée (analyses non reproductibles, traitement de la qualité des données aléatoire…). C’est beau, certes, mais difficilement transposable en entreprise. Cependant ce courant a déclenché une reconnaissance, a identifié un besoin qui pousse l’adoption de vrais produits technologiques (dont Tableau) qui permettent de faire du beau et du solide. Et ça c’est vraiment mon quotidien !
  • Si ça vous intéresse : je vous encourage à assister aux Data Tuesdays. Entre les présentations des dernières visualisations et la faune toute particulière, c’est une expérience à vivre 😉

Big Data

  • C’est quoi : Un courant technologique, une nouvelle sorte de base de données
  • Pourquoi : Répondre à un besoin spécifique : les 3 V – Vitesse (quasi temps réel), Volume (>TB) et Variété (des types et thèmes de données). Si les bases de données « legacy » (SQL Server, Oracle, MySQL, Teradata…) répondent bien à chaque combinaison de 2 V parmi les 3, il fallait autre chose pour traiter les 3 en même temps.
  • Dans mon quotidien : Ca frémit gentiment, les clients nous demandent des infos sur la techno, ça fait partie de la veille technologique, mais pas encore de business à proprement parler. Par contre je le vois arriver dans mes produits, que ce soit Tableau ou SSIS (via Azure), dans lesquels j’ai à disposition des connecteurs vers Big Data (Hadoop/Hive). Il me faudrait les tester pour voir les contraintes, c’est dans ma to-do list mais pas en haute priorité…
  • Si ça vous intéresse : Le mieux c’est surement d’implémenter la chose. Bon courage, et faites-nous un retour 🙂

Le Cloud (version BI)

  • C’est quoi : Un courant technologique, l’hébergement des services informatiques (base de données entre autres) « sur Internet ».
  • Pourquoi : Les services ainsi hébergés sont disponibles à tous vos utilisateurs à travers une simple connexion Internet. L’infrastructure est complétement virtuelle, elle est gérée par l’hébergeur, les SLA sont censés être garantis et le tout peut évoluer en 3 clics de souris.
  • Dans mon quotidien : Une avalanche de mail de Microsoft pour me convaincre d’utiliser SQL Azure et des private jokes sur la tarification de la chose sur les « SELECT * ». Plus sérieusement, je vous avoue que je suis encore partagé sur le cloud. Côté points positifs, les cas d’utilisation que ce type de techno libère pour le reporting sont excellents. Il n’y a qu’à voir les nouvelles solutions hébergées de dashboarding qui apparaissent, c’est vraiment chouette (oui je vous dois un comparatif, c’est dans les tuyaux !). Côté points négatifs, j’ai encore des réticences à imaginer héberger un datawarehouse dans la durée dans le cloud. D’abord parce que les performances ne sont pas encore là (ETL bridé par la bande passante par exemple), ensuite parce qu’à mon sens le stockage des données d’entreprise doit rester dans l’entreprise.
  • Si ça vous intéresse : Essayez SQL Azure, malgré toutes mes réticences sur le concept ça reste un outil technologique bluffant.

Le In Memory, le stockage vertical, les algorithmes de compression du futur…

  • C’est quoi : Des nouvelles techniques pour les bases de données
  • Pourquoi : Enfin tirer parti des nouvelles architectures physiques des machines modernes (beaucoup de RAM, CPU multi core…)
  • Dans mon quotidien : C’est partout. Que ce soit Tableau (on ne connait pas exactement les optimisations du moteur de Tableau mais c’est bien dans la même veine) ou la BI Microsoft (xVelocity alias Vertipaq qui est le moteur derrière PowerPivot et SSAS Tabular), ça a été intégré dans mes produits et je l’utilise donc régulièrement. En fait c’est totalement transparent pour nous, en dehors de quelques contraintes de design, c’est juste que les bases sont beaucoup plus rapides sur des opérations historiquement délicates (distinct count…).
  • Si ça vous intéresse : Si vous êtes dans le décisionnel il y a de fortes chances que vous l’utilisiez déjà. En effet en plus de Tableau et Microsoft, la plupart des éditeurs ont déjà intégré ces nouvelles sauces à leurs produits : SAP HANA, le moteur de QlikView, IBM TM1, Oracle en mode appliance, Tibco Spotfire…

Je conclue ce petit tour d’horizon en vous rappelant que la BI Agile j’en ai déjà assez parlé dernièrement et en vous annonçant que la BI Self-Service c’est mon nouveau sujet chouchou ! De ce sujet on en avait déjà causé sur FrenchConnection.bi et j’y consacrerai un autre article bientôt.

Dilbert du 06/07/2012

Je l’aime beaucoup celui là 🙂

Dilbert du 06/07/2012

Traduction approximative :

Boss : Ce dont nous avons besoin c’est une stratégie globale qui stimulerait notre innovation

Dilbert : Ou vous pourriez juste arrêter d’étouffer l’innovation dont nous disposons déjà.

Boss : C’est l’idée la plus stupide que j’ai jamais entendu.

Dilbert : Et voilà.