Michael Stonebraker casse la baraque!

Tout d’abord, qui est ce Michael Stonebraker?

Bah juste un vieux de la vieille de la base de données. Il a contribué à Ingres, Postgre, il est prof au MIT, et maintenant il bosse dans 4/5 boîtes autour des bases de données à stockage vertical. Il en impose en somme. Et si je peux me permettre, il n’est pas très photogénique… Mais ce n’est manifestement pas un défaut pour sa carrière 🙂

Ensuite, qu’a dit ce monsieur qui me fait m’exclamer qu’il casse la baraque? En fait pas grand chose, c’était juste une tentative foireuse de faire un jeu de mot avec son nom…

Mais bon, il a quand même dit des choses dernièrement, particulièrement, il a fait son top 10 des vérités à propos des data-warehouses. Et tout d’un coup, ça devient vachement plus intéressant que tout ce que j’ai dit avant non?

Pour le commentaire de texte, on va se faire ses vérités une par une, du goret quoting comme on disait à mon époque, ça sera plus simple:

  • 1 – Étoiles et Flocons c’est bon, mangez-en

Hum, rien à redire là dessus, avec une nette préférence pour les étoiles par ici!

  • 2 – Le stockage vertical (par colonne) remplacera à terme le stockage par ligne chez les éditeurs de DWH

Là, ça me semble plus être du whisful thinking de la part d’un gars qui a mis tous ses oeufs dans un panier vertical qu’une prédiction réellement motivée. En même temps il a prévenu dans l’intro qu’il était biaisé vers sa techno.

Dans tous les cas, si ça doit arriver, je verrais bien un paramètre de base dans SQL Server qui indiquerait le type de stockage souhaité: colonne ou ligne. Ça ce serait sympa!

  • 3 – La vaste majorité des DWH ne sont pas candidats pour le stockage in-memory

En gros: les DWH sont trop gros pour être stockés en RAM ou sur de la flash, compte tenu du prix de ces mémoires par rapport à la quantité de données à stocker. Ils seront donc cantonnés aux disques durs pour un bout de temps.

Rien à redire là dessus, il prend pas trop de risques en même temps.

Mouais. Faut voir ce qu’il appelle le « marché ». S’ils ne considèrent que les DWH qui pèsent des Peta, alors là oui. Pour la majorité des DWH, ceux qui sont dans les Giga, ça risque de prendre plus de temps. Dans tous les cas, nous on est prêt, on a rien à craindre!

  • 5 – Objectif : des bases qui ne se paramètrent pas

Je suis carrément d’accord là dessus. Ça dit que l’augmentation du nombre d’options et de paramètres dans la configuration des bases implique une baisse de la compétence des dBa. C’est normal! Avec 20 pages de paramètres, il faut des magiciens pour arriver à tuner correctement une base en perte de performance.

Et j’aime l’approche prise du côté SQL Server sur ce point: installer une base ça prend 15 minutes. Elle pourra tourner pendant 5 ans sans aucun problème. La plupart des options sont très correctement configurées par défaut. Et si besoin, on peut quand même accéder à 15 pages d’options pour les cas bien tordus.

  • 6 – Les vendeurs d’appliances devraient oublier le hard

Encore d’accord. Teradata héberge des gens extrêmement brillants, mais je n’accroche pas du tout à leur modèle.

Pour la BI sur laquelle je bosse, c’est trop compliqué, trop figé et surtout trop cher.

  • 7 – Un serveur par type d’application

Mouais. Tout dépend de l’échelle des applications. On peut faire cohabiter de l’OLTP et de l’OLAP (au sens large) dans une même base SQL Server sans tout crasher, tout dépend du dimensionnement et des volumétries.

Ce point 7 c’est surtout une occasion pour reparler de stockage vertical! Quel coquin!

  • 8 – Toutes les appli BI veulent de la haute dispo

Hum. Toutes? Là on va pas être d’accord Mister!

Toutes les applis qui nécessitent des dizaines de serveurs de plusieurs K€, 25 personnes à temps plein pour la maintenance et qui brassent des terabytes de données? Là on est d’accord!

Mais réduire la BI à ça, c’est bien dommage.

  • 9 – Les bases devraient supporter le « online reprovisioning »

Joker, pas mon sujet.

  • 10 – La virtualisation ça ne marche pas génial pour les bases de données

Même remarque que pour la 8. Encore une fois le monde du BI est réduit aux monstres. C’est bien dommage!

Conclusion:

Je suis d’accord sur 4 points (1,3,5,6), pas d’accord sur 1 (2), et pas d’accord sur la définition du marché de la BI sur 4 (4,7,8,10). Plus un NSPP, le 9.

Et vous? 🙂

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s