Planifier la source de données

Vos données sont au centre de Tableau. Votre succès dans l’exploration des données, la réponse aux questions et la création de visualisations pour vous-même ou d’autres personnes dépendent dans tous les cas des données sous-jacentes.

Si votre objectif est de procéder à une exploration rapide ou une analyse ad hoc, vous pourrez probablement vous lancer, vous connecter à certaines données, faire glisser et déposer quelques données pour créer des visualisations et repartir avec les informations dont vous avez besoin. Par contre, si votre objectif est de créer une analyse ou une source de données qui sera utilisée plus d’une fois, il est préférable de bien réfléchir et de planifier votre source de données.

Sources de données Tableau

Une source de données Tableau est le lien entre votre source de données et Tableau. En bref, elle englobe la somme de vos données (que ce soit une connexion en direct ou un extrait), les informations de connexion, les noms des tables et des feuilles contenant des données, et les personnalisations que vous effectuez en plus de vos données pour les utiliser dans Tableau . Ces personnalisations incluent par exemple la façon dont les données sont combinées et les métadonnées telles que les calculs, les champs renommés et le formatage par défaut.

Une source de données Tableau peut contenir plusieurs connexions de données à des bases de données ou fichiers différents. Les informations de connexion incluent l’emplacement des données, par exemple le nom et le chemin d’accès du fichier ou un emplacement réseau, et des détails sur le mode de connexion à vos données, par exemple le nom du serveur de base de données et les informations de connexion du serveur.

Remarque : les termes source de données et connexion de données ont été utilisés sans distinction particulière dans le passé et leur différence peut ne pas apparaître clairement dans la documentation plus ancienne.

Il est également important de garder à l’esprit la différence entre la source de données Tableau (l’accès de Tableau à vos données et toutes les personnalisations qui peuvent être impliquées) et les données sources elles-mêmes (par exemple une base de données ou une feuille de calcul Excel). La planification d’une source de données dans le sens de la conception d’une base de données n’entre pas dans le cadre de cette rubrique.

Les sources de données Tableau peuvent rester intégrées dans le classeur où elles ont été créées à l’origine, ou elles peuvent être publiées séparément. Les sources de données publiées permettent de centraliser et de mettre à l’échelle les sources de données sélectionnées. Consultez Meilleures pratiques pour les sources de données publiées pour plus d’informations.

Combiner les données

Si vos données proviennent d’une seule table, vous pouvez vous connecter à vos données, faire glisser une table sur l’espace de travail pour créer la source de données, puis commencer à créer votre vue. Mais si vos données sont réparties sur plusieurs tables ou sur plusieurs bases de données, vous devrez les combiner. La combinaison des données est disponible sur le volet Source de Données.

Base de données uniqueBases de données multiples
  1. Connectez-vous à vos données. Une source de données est alors créée.
  2. Faites glisser une table ou une feuille de calcul sur l’espace de travail et déposez-la.
  3. Faites glisser une deuxième table ou une feuille sur l’espace de travail et déposez-la. Soit des « noodles » se forment, signifiant qu’une relation automatique s’est formée, soit le dialogue Modifier la relation s’ouvre, vous invitant à indiquer à Tableau quel est le champ reliant les deux tables.
  4. Continuez à ajouter des tables.
  1. Connectez-vous à vos données. Une source de données est alors créée.
  2. Faites glisser une table ou une feuille de calcul sur l’espace de travail et déposez-la.
  3. Après avoir sorti la première table de données, cliquez sur le lien Ajouter à droite de l’en-tête Connexions dans le volet gauche.
  4. Passez d’une connexion de données à l’autre dans la volet gauche, puis faites glisser la table désirée sur la toile et déposez-la. Soit des « noodles » se forment, signifiant qu’une relation automatique s’est formée, soit le dialogue Modifier la relation s’ouvre, vous invitant à indiquer à Tableau quel est le champ reliant les deux tables.
  5. Continuez à ajouter des tables, en passant d’une connexion de données à l’autre.

Remarque : pour relier les tables entre différentes bases de données, vous devez les ajouter en tant que connexions de données au sein de la même source de données, et non comme une nouvelle source de données. Les connexions de données sont ajoutées à partir du lien Ajouter dans le volet gauche. Vous pouvez créer de nouvelles sources de données à partir du menu Données ou du menu déroulant depuis l’icône à côté du nom de la source de Données, comme illustré dans l’image ci-dessous.

Méthodes de combinaison des données

Les relations constituent le mode par défaut de combinaison des données dans Tableau. Elles permettent de combiner de façon dynamique et flexible les données issues de plusieurs tables pour l’analyse. Si nécessaire, les tables peuvent également être liées ou réunies. Les sources de données peuvent également être fusionnées. Examinons les différentes options de combinaison des données dans Tableau et certaines des situations où chaque méthode est utile.

 

RelationsÉtablir le potentiel de jointures entre deux tables en fonction de champs reliés. Ne fusionne pas les données ensemble pour créer une nouvelle table fixe. Au cours de l’analyse, interroge automatiquement les tables pertinentes utilisant les jointures contextuellement appropriées pour générer une table personnalisée des données pour cette analyse.

Conserve le niveau de détail approprié, ne perd pas de données, conserve les agrégations appropriées et gère les valeurs null.

JointuresFusionnez deux tables de données basés sur une clause de jointure et un type de jointure pour former un nouvelle table fixe de données. Souvent utilisées pour ajouter de nouvelles colonnes de données à travers la même structure de lignes de base.

Peut causer une perte de données dans certains types de jointure si les champs ne sont pas présents dans toutes les tables. Peut causer la duplication des données si les tables sont à différents niveaux de détail.

UnionsFusionnez deux tables de données ou plus pour former une nouvelle table fixe de données. Utilisés pour ajouter des (nouvelles lignes de) données sur la même structure de colonnes de base.
FusionsTravaillez sur deux ou plusieurs sources de données Tableau distinctes. Les données restent séparées. Tableau interroge les sources de données indépendamment et visualise les résultats ensemble dans la vue, en fonction des champs de liaison établis pour cette feuille. Reproduit le comportement d’une jointure gauche et peut filtrer les données issues de sources de données secondaires.

Remarque : il est également possible de combiner les données avec SQL personnalisé. La plupart du temps, il est préférable de combiner les données directement dans l’espace de travail ou avec la fusion des données. Tableau bénéficie ainsi de la plus grande flexibilité d’optimisation. Cependant, dans certains cas, vous pouvez être amené à utiliser SQL personnalisé. Gardez à l’esprit que ce choix peut avoir une incidence sur les performances parce que Tableau est forcé d’exécuter la déclaration SQL personnalisée telle qu’elle est écrite.

Relations

La relation est une méthode de travail avec les données de plusieurs tables basées sur des champs partagés — colonnes — entre ces tables. L’établissement d’une relation informe Tableau de la manière dont les lignes peuvent être connectées entre des tables. Tableau détient cette information mais ne réunit pas immédiatement les lignes comme c’est le cas avec une jointure codée en dur. Au lieu de cela, lorsqu’une visualisation est créée, les champs impliqués dans l’analyse sont retracés à travers la relation et les jointures appropriées sont créées de manière à renvoyer les données correctes.

Étant donné que les données ne sont jamais regroupées de force dans une seule table en dehors du contexte d’une visualisation, les relations sont utiles lorsque les données sont à différents niveaux de détail, ou granularité, par exemple si vous avez besoin de travailler avec des données sur les précipitations quotidiennes dans une table, mais les températures horaires dans une autre.

Pour savoir comment combiner des tables à l’aide de relations, consultez Relier vos données.

Pour plus d’informations sur la combinaison de tables à l’aide de relations, consultez Relier vos données et ces billets de blog Tableau :

Remarque : à partir de Tableau version 2024.2, le modèle de données Tableau prend en charge l’analyse multi-faits et les dimensions partagées via des relations multi-faits. Pour plus d’informations, consultez À propos des modèles de données avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre), Dans quels cas utiliser un modèle avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre) et Créer un modèle de données avec relations multi-faits(Le lien s’ouvre dans une nouvelle fenêtre).

Jointure

La jointure est une méthode consistant à combiner des tables reliées par des champs communs. Le résultat de la combinaison de données à l’aide d’une jointure est une table qui s’étend à l’horizontale suite à l’ajout de colonnes de données.

Pour plus d’informations sur les jointures de données dans Tableau, voir Lier vos données.

Fusion des données

Lorsque vous utilisez la fusion des données pour combiner vos données, vous combinez des données dans ce qui est appelée une source de données principale avec des champs communs provenant d’une ou de plusieurs sources de données secondaires.

La fusion des données est utile lorsque vous devez modifier la configuration de la source de données feuille par feuille, lorsque vous souhaitez combiner des bases de données qui ne permettent pas les relations ou les jointures telles que les sources de données de type multidimensionnelles ou les sources de données publiées.

Le résultat de la combinaison de données à l’aide d’une fusion des données est une table virtuelle qui s’étend à l’horizontale suite à l’ajout de colonnes de données. Les données de chaque source de données sont agrégées à un niveau commun avant d’être affichées ensemble dans la visualisation.

Pour plus d’informations sur la fusion des données et la manière de fusionner vos données dans Tableau, consultez Combiner vos données.

Union

L’union consiste à ajouter des valeurs (des lignes) à des tables. Vous pouvez réunir des tables si elles ont les mêmes colonnes. Le résultat de la combinaison de données à l’aide d’une union est une table virtuelle qui possède les mêmes colonnes mais s’étend à la verticale suite à l’ajout de lignes de données.

Vous pouvez réunir des tables de l’une des deux manières suivantes : manuellement ou à l’aide de recherche par caractères génériques. Pour plus d’informations sur l’union de données à l’aide de l’une de ces méthodes dans Tableau, consultez Réunir vos données.

Considérations relatives aux sources de données Tableau

Avant toute chose, assurez-vous de déterminer clairement l’objectif de la source de données. Si vous créez une source de données fourre-tout destinée à une grande variété d’utilisateurs avec des questions larges, vous vous y prendrez différemment que si vous construisiez une source de données de niche optimisée pour les performances. Il est important de connaître votre objectif dès le départ.

Dans cet objectif, vous devez considérer et planifier plusieurs éléments avant de créer une source de données dans Tableau :

  • Emplacement et accès
  • Forme et propreté
  • Modèle de données et combinaison des données
  • Métadonnées et personnalisation
  • Évolutivité, sécurité et découverte
  • Performances et actualité

Emplacement et accès

L’emplacement de vos données peut aussi simple qu’un fichier Excel sur votre ordinateur ou une feuille Google que vous avez créée, ou aussi complexe que plusieurs bases de données utilisant diverses technologies. L’accès peut également impliquer des pilotes ou des connecteurs spécifiques pour une base de données ou des informations de connexion pour un serveur de base de données.

Questions à considérer :

  • Les utilisateurs de Tableau corrects disposent-ils d’un accès et d’autorisations pour les données et Tableau ?
  • Quel est le compte utilisateur à utiliser pour se connecter à la base de données ?
  • Le filtrage utilisateur ou la sécurité au niveau des lignes sera-t-il nécessaire ?
  • Les données de source résident-elles sur site ou dans le cloud ?
  • Existe-t-il des Connecteurs pris en charge ?
  • Des limitations s’appliquent-elles à cette base de données (prend-elle en charge toutes les fonctionnalités que vous espérez utiliser) ?

Forme et propreté

Votre entreprise possède peut-être déjà des données bien structurées auxquelles vous pouvez vous connecter ou des processus ETL que vous pouvez exploiter, ou vous devrez peut-être utiliser Tableau Prep Builder pour effectuer des opérations de nettoyage et de mise en forme pour préparer vos données dans un format utile.

Questions à considérer :

  • Les données sont-elles bien structurées en vue d’une utilisation avec Tableau ?
  • Faut-il utiliser Tableau Prep Builder et Tableau Prep Conductor pour nettoyer et automatiser les flux de préparation des données ?
  • Quels sont les calculs ou les manipulations à effectuer de préférence de manière native dans Tableau ?
  • Certaines de ces données sont-elles superflues ? Manque-t-il des données ?

Modèle de données et combinaison des données

Tableau a besoin savoir comment interroger les données, ce qui est transmis par le Modèle de données Tableau. Si les données proviennent de plusieurs tables, vous devez combiner les données. Les méthodes de combinaison des données incluent les relations, les jointures, les unions et les fusions.

Questions à considérer :

  • Les données sont-elles réparties sur plusieurs systèmes ?
  • Quelle est la meilleure façon de combiner chaque table de données ?

Métadonnées et personnalisation

Les données sont souvent stockées d’une manière peu pratique pour l’utilisateur. Par exemple, les noms de champ par défaut peuvent être lourds, l’utilisateur peut préférer un formatage personnalisé, les définitions d’abréviations ou de codes peuvent manquer, ou des calculs courants peuvent ne pas être présents dans les données sous-jacentes. La création d’une couche sémantique contenant ces informations peut faciliter la compréhension et l’utilisation des données.

Questions à considérer :

  • Quels calculs devraient être ajoutés?
  • Les noms des tables et des champs sont-ils compréhensibles?
  • Les paramètres par défaut pour les champs sont-ils utiles ou doivent-ils être personnalisés ?
  • Des ajustements sont-ils nécessaires pour prendre en charge Tableau Catalog ?
    Notez que la fonctionnalité Explique-moi les données ne prend pas en charge les sources de données multi-tables à ce stade.

Évolutivité, sécurité et découverte

Une source de données peut rester dans le classeur où elle a été créée —une source de données intégrée— ou elle peut être publiée sur Tableau Server ou Tableau Cloud indépendamment de toute analyse en tant que ressource de contenu propre. Cette centralisation des sources de données publiées présente l’avantage supplémentaire de sécurité et de mise à l’échelle, ce qui permet à plusieurs utilisateurs d’accéder à une source de données cohérente. Les sources de données publiées peuvent également tirer parti de Tableau Catalog et des recommandations, et fournir une source unique de vérité pour une entreprise.

Questions à considérer :

  • La source de données devrait-elle rester intégrée dans le classeur ?

(Les questions suivantes partent de l’hypothèse que la source de données est publiée)

Performances et actualité

En outre, les sources de données Tableau peuvent être des connexions en direct aux données source ou les données peuvent être copiées sous forme d’extrait actualisable. Les extraits peuvent améliorer les performances de l’analyse ou éviter que les ressources des systèmes de base de données ne soient accaparées.

Questions à considérer :

  • La connexion de données doit-elle être une connexion en direct ou un extrait ?
  • S’il s’agit d’un extrait, y aura-t-il un calendrier d’actualisation ? (Tableau Server | Tableau Cloud
  • En cas de publication sur Tableau Cloud, faut-il utiliser Tableau Bridge ?

Créer des sources de données de qualité

Une source de données bien conçue et performante peut contenir une grande quantité d’informations. Rien ne vous oblige cependant à publier votre première tentative. Comme pour la création d’une visualisation performante, la création d’une source de données peut être un processus continu. Entraînez-vous à combiner les données dont vous pensez avoir besoin et voyez si vous pouvez créer la visualisation que vous avez en tête. Vous pouvez toujours revenir en arrière et écrire un nouveau calcul ou intégrer une autre table de données. Faites quelques tests d’utilisateur et demandez à un collègue si vos noms de champs sont suffisamment évocateurs.

Bien entendu, il est préférable de publier les sources de données dans lesquelles vous avez confiance et de certifier uniquement celles qui ont passé l’assurance qualité. Dès lors que vous la présentez aux utilisateurs, votre source de données doit être fiable.

Merci de vos commentaires !Avis correctement envoyé. Merci