Fusionner vos données résumées

La fusion des données constitue une méthode de combinaison des données. La fusion des données consiste à compléter les données de la source de données principale par les données de la source de données secondaire.

Lorsque l’une des sources de données que vous utilisez est volumineuse, vous pouvez réduire la durée de requête en utilisant la fusion des données afin de fusionner des données dans la source de données principale avec des données résumées de la source de données secondaire (source de données volumineuse).

Par exemple, supposons que vous ayez deux sources de données : Store - North and Store - South (Magasin - Nord et Magasin - Sud). Store - North est la source de données principale et Store - South est la source de données secondaire volumineuse. Pour réduire les durées de requête en cas d’utilisation d’une source de données volumineuse telle que Store - South, vous pouvez utiliser la fusion des données pour ne fusionner que les données résumées de la source de données secondaire volumineuse (Store - South) avec les données provenant de la source de données principale plus petite et sans doute plus rapide (Store - North).

Pour fusionner les données résumées, vous pouvez procéder ainsi :

  1. Créez une relation entre des sources de données.
  2. Intégrez les données résumées de la source de données secondaire dans la source de données principale.
  3. Comparez les données de la source de données principale dans les données résumées de la source de données secondaire.

Étape 1 : Créer une relation entre les sources de données principale et secondaire.

  1. Téléchargez et ouvrez ce qui suit dans Tableau Public.
    1. Accédez à https://public.tableau.com/profile/tableau.docs.team#!/vizhome/BlendonSummaryData/Sheet1.

    2. Cliquez sur Télécharger le classeur dans le coin supérieur droit.

    Dans le classeur, la dimension Order Date (Date de commande) a été déposée sur l’étagère Colonnes, ce qui en fait le premier champ dans la vue et définit la source de données Store - North comme source de données principale pour la feuille. La source de données Store - South est également incluse dans le classeur et fonctionne comme source de données secondaire volumineuse.

  2. Sélectionnez Données > Modifier les relations.

  3. Dans la boîte de dialogue Relations, sélectionnez Personnalisé, puis cliquez sur Ajouter.

  4. Dans la boîte de dialogue Ajouter/Modifier le mappage des champs, dans les deux listes, cliquez sur la flèche à côté de Order Date (Date de commande), sélectionnez Year(Order Data), puis cliquez sur OK.

  5. Dans la boîte de dialogue Relations, cliquez à nouveau sur Ajouter.

  6. Dans la boîte de dialogue Ajouter/Modifier le mappage des champs, cliquez sur Prod Type 1, puis sur OK.

Étape 2 : Intégrer les données résumées de la source de données secondaire dans la source de données principale

  1. Dans le volet Données, sélectionnez la source de données Store - North.

  2. Sélectionnez Analyse > Créer un champ calculé.

  3. Dans la boîte de dialogue de calcul, procédez comme suit :

    1. Dans la zone de texte du nom, entrez Sales for Store - South.

    2. Dans la zone de texte de formule, entrez la fonction ZN, la fonction SUM et le champ Sales Totals depuis la source de données Store - South.

      Votre formule devrait se présenter ainsi : ZN(SUM([Store - South].[Sales Total]))

      Cette formule extrait simplement les données sur les ventes à partir de la source de données secondaire volumineuse.

  4. Sélectionnez Analyse > Créer un champ calculé.

  5. Dans la boîte de dialogue de calcul, procédez comme suit :

    1. Dans la zone de texte du nom, entrez Total Sales (North and South).

    2. Dans la zone de texte Formule, saisissez ce qui suit :

      IF ISNULL([Sales for Store - South]) THEN 0 ELSE [Sales for Store - South]END

      +

      IF ISNULL (SUM([Sales Total])) THEN 0 ELSE SUM([Sales Total]) END

      Cette formule ajoute les données sur les ventes provenant de la source de données secondaire volumineuse aux données sur les ventes provenant de la source de données principale pour obtenir les ventes combinées de Store - South et Store - North.

Étape 3 : Comparer les données de la source de données principale dans les données résumées de la source de données secondaire

  1. Depuis le volet Données, faites glisser Order Date vers l’étagère Colonnes et Prod 1 vers l’étagère Lignes.

  2. Faites glisser Noms de mesures vers l’étagère Lignes, puis vers l’étagère Filtres.

  3. Dans la boîte de dialogue Filtre, cliquez sur Aucun, puis sélectionnez les cases à cocher Sales Total, Sales for Store - South, Total Sales (North and South).

  4. Depuis le volet Données, faites glisser Valeurs de mesures vers Texte.

Le résultat final est une vue qui résume les données de la source de données principale et de la source de données secondaire pour l’année de commande et la catégorie de produit.

Remarque : les exemples de données sur les ventes dans Store North et Store - South sont identiques et produisent les mêmes résultats pour les champs Sales Total et Sales for Store - South.