Technologies de Tableau

Révolution après révolution

En 2003, Tableau a démarré à l'Université de Stanford grâce à la technologie VizQL™, qui révolutionne complètement la manière de travailler avec les données en permettant l'utilisation des fonctions par de simples glisser-déposer pour créer des visualisations complexes. La principale innovation est un langage de requêtes breveté qui traduit vos actions en requêtes de base de données, puis exprime les réponses sous forme graphique.

L'autre grande innovation a été la possibilité d'effectuer des analyses ad hoc sur des milliards de lignes de données en quelques secondes grâce à Hyper, la technologie de moteur de données de Tableau. Hyper, une technologie essentielle de la plate-forme Tableau, utilise la génération de code dynamique propriétaire et des techniques avancées de parallélisation pour accélérer la création des extraits et l'exécution des requêtes.

Hyper est une technologie de moteur de données en mémoire très performante qui permet d'analyser plus rapidement des ensembles de données volumineux ou complexes grâce à une évaluation efficace des requêtes analytiques directement dans la base de données transactionnelle. Composante essentielle de la plate-forme Tableau, Hyper utilise la génération de code dynamique propriétaire et des techniques avancées de parallélisation pour accélérer la création des extraits et l'exécution des requêtes.

La particularité d'Hyper

Ces 10 dernières années, les moteurs de données en mémoire et les technologies de base de données analytiques ont permis une amélioration incroyable des performances des requêtes grâce à des techniques telles que l'échantillonnage et la récapitulation. Cependant, ces améliorations ont un coût. De nombreux systèmes sacrifient les performances d'écriture, qui sont essentielles à la création rapide d'extraits et à l'efficacité de l'actualisation, en faveur de l'optimisation des performances de la charge de travail analytique. Pourtant, la lenteur de l'écriture aboutit à des données obsolètes et déconnectées. Au final, cela produit un décalage entre les utilisateurs et les données qu'ils souhaitent analyser. Avec Hyper, notre mission est de les rapprocher de leurs données en accélérant les écritures et les performances des charges de travail analytiques. En résumé, Hyper fournit plus rapidement des données toujours à jour pour vous permettre d'analyser une vue plus étendue et complète de vos données.

Une architecture système plus efficace

Avec Hyper, les transactions et les requêtes analytiques sont traitées dans la même banque de colonnes. Aucun autre traitement n'est requis après l'ingestion des données. Cela permet de réduire les données obsolètes et les décalages entre les systèmes spécialisés. L'approche unique d'Hyper permet de véritablement consolider dans un système unique des charges de travail impliquant de nombreuses opérations de lecture et d'écriture. En d'autres termes, il est possible de bénéficier d'une création rapide des extraits sans sacrifier la rapidité du traitement des requêtes.

Nouvelle approche de l'exécution des requêtes : génération de code dynamique

Hyper utilise un nouveau modèle d'exécution : la compilation à la volée. Beaucoup d'autres systèmes reposent sur un modèle traditionnel d'exécution des requêtes qui ne peut pas tirer pleinement parti du matériel multicœur actuel. Hyper, en revanche, optimise et compile les requêtes dans un langage machine personnalisé pour exploiter au mieux le matériel sous-jacent. Lorsqu'il reçoit une requête, il crée une arborescence, l'optimise de manière logique et l'utilise ensuite comme référence afin de créer un programme unique, qui sera ensuite exécuté. Cela permet de mieux tirer profit des dernières avancées des composants matériels pour accélérer l'exécution des requêtes.

Mieux exploiter le matériel : parallélisation basée sur la fragmentation

Nous avons conçu Hyper pour des environnements multicœurs et étendus. Notre modèle de parallélisation repose sur la fragmentation du travail en très petits « morceaux ». Ces fragments sont attribués efficacement à tous les cœurs disponibles, ce qui permet à Hyper de mieux tenir compte des différences de vitesse de ces derniers. Cela se traduit par une meilleure utilisation du matériel et une accélération des performances.

Hyper a commencé par un projet de recherche de l'Université technique de Munich (TUM) en 2010. C'est devenu une entreprise en 2015. Le but était de faire connaître Hyper et de livrer une version commerciale de la technologie. Hyper a été racheté par Tableau en 2016 et cette technologie bénéficie désormais au moteur de données Tableau.

Nativement visuel, et donc plus rapide

Au cœur de Tableau se trouve une technologie propriétaire qui permet de mieux comprendre les données grâce aux visualisations. Un outil d'analyse traditionnel vous oblige à analyser les données dans des lignes et des colonnes, à choisir un sous-ensemble à présenter, à organiser ces données dans une table, puis à créer un graphique. VizQL supprime ces étapes et représente directement vos données de manière visuelle, ce qui vous permet de voir instantanément le résultat de vos actions pendant l'analyse. Vous comprenez bien mieux vos données et travaillez beaucoup plus vite qu'avec les méthodes conventionnelles.

VizQL permet de créer une grande variété de visualisations.

Un nouveau langage pour les données vous permet d'en dire plus encore

Cette architecture inédite est aux interactions avec des données sous forme visuelle ce qu'a été SQL aux interactions avec les données sous forme textuelle. Les instructions VizQL décrivent une infinité de visualisations multidimensionnelles avancées. Grâce à VizQL, les utilisateurs disposent d'une interface d'analyse unique et d'un outil de visualisation de base de données permettant de produire un grand nombre de résumés graphiques. Tableau peut créer un nombre incroyable de visualisations, qu'il s'agisse de graphiques à barres ou en courbes, de cartes ou de vues connexes avancées. Cette flexibilité vous permet de comprendre les données d'une toute nouvelle manière. Vous trouvez des informations qui seraient perdues si vous deviez essayer de faire rentrer vos données dans des modèles de graphiques rigides.

Prise en charge des modes de raisonnement naturels

Le raisonnement consiste naturellement à se poser des questions et à trouver les réponses en progressant étape par étape et en fonction des nouvelles informations. Il est rare de savoir exactement où l'on va lorsque l'on commence une analyse. C'est pourtant ce que les outils BI traditionnels vous demandent. Il existe cependant une alternative : VizQL vous permet de parcourir visuellement vos données et de trouver la meilleure façon de les représenter. Vous apprenez au fur et à mesure, ajoutez des données si nécessaire et obtenez finalement des informations bien plus précises. C'est ce que nous appelons le cycle de l'analyse visuelle. Avec ce cycle, vous pouvez transmettre de bien meilleures histoires basées sur vos données.

Un modèle unique au monde

Grâce à VizQL, la visualisation et l'analytique rapide sont devenues réalité. Même avec peu ou pas de formation, les utilisateurs peuvent voir et comprendre les données plus rapidement que jamais et d'une manière inédite. C'est le plus important.

Informations supplémentaires

Livre blanc : L'analytique visuelle pour tous

Livre blanc : Montre-moi, l'outil qui suggère des présentations pour l'analyse visuelle