L'annonce ne pouvait pas tomber à un meilleur moment. Alors que Snowflake organise cette semaine sa conférence annuelle à San Francisco, son plus proche concurrent Databricks vient tout juste de conclure un accord pour acquérir Tabular, une société de gestion de données - opération qui devrait être finalisée au cours du deuxième trimestre fiscal de Databricks. Le montant n'a pas été communiqué.
Fondée par trois anciens de Netflix, Ryan Blue, Daniel Weeks – tous deux fondateurs d'Apache Iceberg – et Jason Reid, la start-up fournit une plateforme de stockage "qui se connecte à n'importe quelle couche de calcul" et promet d'"éliminer le verrouillage des données des offres full stack".
Un coup porté à Snowflake
Cette acquisition n'a rien d'anodin à une période charnière pour la gestion des données et dans un contexte de montée en puissance de l'intelligence artificielle. Lors de son événement, Snowflake a fait part de plusieurs annonces autour de l'IA, la gestion des données et le format de table ouvert Apache Iceberg, notamment avec le lancement de Polaris Catalog, un catalogue de données ouvert pour ce format de table qui a gagné en popularité ces dernières années.
Avec Polaris, la promesse de la firme est simple – du moins sur le papier –, aucun moteur de requête d'un fournisseur ne peut posséder et verrouiller les données clients. Et c'est précisément sur ce point que Databricks vient défier le spécialiste du data cloud.
L'interopérabilité des données, nouvelle bataille pour les entreprises
L'acquisition de Tabular représente un pas en avant pour Databricks vers l'open source et l'interopérabilité des données, mot clé qui résonne également chez son concurrent. La firme indique dans un communiqué avoir "l'intention de travailler en étroite collaboration avec les communautés Delta Lake et Iceberg afin d'apporter la compatibilité de format au Lakehouse ; à court terme, à l'intérieur de Delta Lake UniForm et à long terme, en évoluant vers un standard d'interopérabilité unique, ouvert et commun".
Pour mémoire, Databricks a lancé l'architecture Lakehouse en 2020 pour permettre l'intégration des charges de travail de data warehousing traditionnelles avec les charges de travail d'IA sur une copie unique et gouvernée des données. Pour que cela fonctionne, toutes les données doivent être dans un format ouvert afin que différentes charges de travail, applications et moteurs puissent accéder aux mêmes données. Avec son architecture Lakehouse, la firme entend bien répondre à cette problématique. Et les chiffres semblent lui donner raison, car à date, quatre ans plus tard, 74% des entreprises ont déployé cette architecture.

L'année dernière, Databricks a introduit Delta Lake UniForm. Les tables UniForm assurent l'interopérabilité entre Delta Lake, Iceberg et Hudi, et prennent en charge l'interface de catalogue d'Iceberg afin que les entreprises puissent utiliser les moteurs et outils d'analyse qui leur sont déjà familiers, pour toutes leurs données. Avec l'arrivée de l'"équipe originale d'Iceberg" – pour reprendre les termes de Databricks – la firme affiche des ambitions fortes, notamment autour de Delta Lake UniForm.
La guerre s'intensifie
Toutefois, Databricks devra faire face aux ambitions de son concurrent. Ce dernier n'a pas manqué de réagir à cette acquisition, notamment par la voix de son directeur de la gestion produit pour les parties stockage et data engineering, James Malone. "L'achat de Tabular par Databricks met en évidence deux différences philosophiques majeures avec Snowflake (si vous ne pouvez pas les battre, achetez-les)".
Il pointe du doigt deux traits qui font défaut à Databricks : son choix de s'emparer d'une entreprise plutôt que de travailler avec et de l'inclure dans le développement de solutions logicielles, et son besoin de contrôler. "Databricks ne supporte pas ce qu'il ne peut pas contrôler", lâche James Malone, avant d'ajouter : "C'est important - une norme ouverte l'est moins lorsque vous devez la contrôler pour la soutenir. Nous nous sommes tous engagés à faire en sorte que Polaris fonctionne entre nous, pour de vrai".
Snowflake pas si blanc que ça dans l'histoire ?
Cependant, à écouter Ali Ghodsi, co-fondateur et CEO de Databricks, Snowflake aurait également sa part de responsabilité dans cette querelle de clocher. "[…] le paradigme lakehouse a été divisé entre les deux formats les plus populaires : Delta Lake et Iceberg. Databricks et Tabular travailleront avec la communauté open source pour rapprocher les deux formats au fil du temps, en augmentant l'ouverture et en réduisant les silos et les frictions pour les clients".
Interrogé à ce sujet, Benoît Dageville, co-fondateur de Snowflake, n'a pas souhaité commenter. Il sera donc intéressant de suivre l'évolution de ces deux solutions que sont Polaris et Uniform. En attendant, Databricks tient sa conférence annuelle du 10 au 13 juin prochain et l'événement promet d'être riche en annonces.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
