Créer des extraits sur le Web

Vous pouvez extraire vos sources de données sur le Web (sans utiliser Tableau Desktop) pour améliorer les performances de la source de données et prendre en charge des fonctions analytiques supplémentaires. Lorsque vous extrayez votre source de données, Tableau copie les données de votre magasin de données distant sur Tableau Server ou Tableau Cloud. Pour en savoir plus sur les avantages de l’extraction de vos données, consultez Extraire vos données. Sur le Web, vous pouvez créer des extraits pendant que vous êtes dans la création Web ou dans le serveur de contenu.

Créer des extraits dans la création Web

Vous pouvez créer des extraits directement dans la création Web, avec des paramètres d’extraction par défaut.

Extraire une source de données intégrée dans la création Web

Volet Source de données montrant le type de connexion d’extrait

Pour créer un extrait dans la création Web :

Conseil : il est recommandé de finaliser votre modèle de données avant de créer l’extrait. La création d’extrait peut prendre beaucoup de temps et toute modification de votre modèle de données, par exemple l’ajout de nouvelles tables logiques, invalidera l’extrait.

  1. Cliquez sur l’onglet Source de données dans le coin inférieur gauche du volet de création Web. Pour les nouveaux classeurs, vous commencerez dans l’onglet Source de données.
  2. Dans le coin supérieur droit, modifiez le type de connexion de En direct en Extrait.
  3. Cliquez sur Créer un extrait. La boîte de dialogue Création d’un extrait s’affiche.

La création d’extrait peut prendre beaucoup de temps et vous pouvez fermer votre session de création pendant ce processus. Pour faire en sorte que votre création d’extrait ne soit pas perdue, dans la boîte de dialogue, cliquez sur M’avertir une fois l’opération terminée afin de spécifier un emplacement d’enregistrement pour le classeur extrait. Si votre extrait réussit, votre classeur sera enregistré à l’emplacement spécifié et vous serez informé que vous pouvez continuer votre session de création Web. Si votre création d’extrait échoue, vous serez informé que l’extrait n’a pas pu être créé et vous pourrez restaurer vos modifications non enregistrées en rouvrant le classeur original dans la création Web.

Définir vos paramètres d’extrait

Volet Données d’extrait montrant la sélection pour les tables logiques ou physiques

Vous pouvez sinon configurer une ou plusieurs des options suivantes pour indiquer à Tableau comment stocker, définir les filtres et limiter la quantité de données dans votre extrait :

  • Déterminer le mode de stockage des données d’extrait

    Vous pouvez demander à Tableau de stocker les données dans votre extrait en utilisant l’une de ces deux structures (schémas) : tables logiques (schéma dénormalisé) ou tables physiques (schéma normalisé). Pour plus d’informations sur les tables logiques et tables physiques, consultez Modèle de données Tableau.

    L’option choisie dépend de vos besoins.

    • Tables logiques

      Stockent les données à l’aide d’une table d’extrait pour chaque table logique de la source de données. Les tables physiques qui définissent une table logique sont fusionnées et stockées avec cette table logique. Par exemple, si une source de données était constituée d’une seule table logique, les données seraient stockées dans une seule table. Si une source de données était composée de trois tables logiques (chacune contenant plusieurs tables physiques), les données d’extrait seraient stockées dans trois tables, une pour chaque table logique.

      Sélectionnez Tables logiques pour limiter la quantité de données dans votre extrait avec des propriétés d’extrait supplémentaires comme les filtres d’extrait, l’agrégation, la fonctionnalité N supérieurs ou d’autres fonctionnalités qui nécessitent des données dénormalisées. À utiliser également lorsque vos données utilisent des fonctions directes (RAWSQL). Il s’agit de la structure par défaut que Tableau utilise pour stocker les données d’extrait. Si vous utilisez cette option lorsque votre extrait contient des liaisons, les liaisons sont appliquées lors de la création de l’extrait.

    • Tables physiques

      Stockent les données à l’aide d’une table d’extrait pour chaque table physique de la source de données.

      Sélectionnez Tables physiques si votre extrait comporte des tables combinées avec une ou plusieurs jointures d’égalité et remplit les conditions d’utilisation de l’option Tables physiques répertoriées ci-dessous. Si vous utilisez cette option, les liaisons sont effectuées au moment de la requête.

      Cette option peut potentiellement améliorer les performances et réduire la taille du fichier d’extrait. Pour plus d’informations sur la manière dont Tableau vous recommande d’utiliser l’option Tables physiques, consultez Conseils d’utilisation de l’option Tables physiques dans l’aide de Tableau Desktop. Dans certains cas, vous pouvez également utiliser cette option comme solution pour la sécurité au niveau des lignes. Pour plus d’informations sur la sécurité au niveau des lignes à l’aide de Tableau, consultez Restreindre l’accès au niveau des lignes de données dans l’aide de Tableau Desktop.

      Conditions d’utilisation de l’option Tables physiques

      Pour stocker votre extrait à l’aide de l’option Tables physiques, les données de votre extrait doivent remplir toutes les conditions énumérées ci-dessous.

      • Toutes les jointures entre les tables physiques sont des jointures d’égalité (=)
      • Les types de données des colonnes utilisées pour les relations ou les jointures sont identiques
      • Aucune fonction directe (RAWSQL) n’est utilisée
      • Aucune actualisation incrémentielle n’est configurée
      • Aucun filtre d’extrait n’est configuré
      • Aucune option N premiers ou d’échantillonnage n’est configurée

      Lorsque l’extrait est stocké en tant que tables physiques, vous ne pouvez pas lui ajouter des données. Pour les tables logiques, vous ne pouvez pas ajouter des données à des extraits qui contiennent plus d’une table logique.

    Remarque : les options Tables logiques et Tables physiques affectent uniquement la manière dont les données de votre extrait sont stockées. Les options n’affectent pas la manière dont les tables de votre extrait s’affichent dans le volet Source de données.

    Déterminer la quantité de données à extraire 

    Cliquez sur Ajouter pour définir un ou plusieurs filtres afin de limiter la quantité de données extraites en fonction des champs et de leurs valeurs.

    Agréger les données dans l’extrait 

    Sélectionnez Agréger les données pour les dimensions visibles pour agréger les mesures à l’aide de leur agrégation par défaut. L’agrégation des données permet de consolider les lignes, de minimiser la taille du fichier d’extrait et d’augmenter les performances.

    Lorsque vous choisissez d’agréger les données, vous pouvez également choisir de Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc. Les exemples ci-dessous expliquent comment les données seront extraites pour chaque option d’agrégation choisie.

    Données d’origineChaque enregistrement apparaît sur une ligne distincte. Vos données contiennent sept lignes.
    Agréger les données pour les dimensions visibles

    (pas de regroupement)

    Les enregistrements avec la même date et la même région ont été agrégés dans une seule ligne. Votre extrait contient cinq lignes.
    Agréger les données pour les dimensions visibles
    (regrouper les dates dans Mois)
    Les dates ont été regroupées au niveau Mois et les enregistrements au sein de la même région ont été agrégés dans une seule ligne. Votre extrait contient trois lignes.
    • Choisir les lignes à extraire

      Sélectionnez le nombre de lignes que vous souhaitez extraire.

      Vous pouvez extraire Toutes les lignes ou les lignes N premiers. Tableau applique d’abord les filtres et les agrégations, puis extrait le nombre de lignes des résultats filtrés et agrégés. Les options du nombre de lignes dépendent du type de source de données à partir duquel vous obtenez l’extrait.

      Remarques :

      Toutes les sources de données ne prennent pas en charge l’échantillonnage. Il se peut que l’option Échantillonnage ne s’affiche pas dans la boîte de dialogue Extraire les données.

      Tous les champs que vous masquez en premier dans la page Source de données ou dans l’onglet de feuille seront exclus de l’extrait.

      Configurer les paramètres d’actualisation incrémentielle

      La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données. Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez simplement ajouter les nouvelles transactions de chaque jour. Pour avoir une option incrémentielle lorsque vous planifiez une actualisation, vous devez d’abord en définir les paramètres ici.

      Vous pouvez préférer une actualisation complète pour être sûr de disposer des données les plus récentes.

      Remarque : si la structure des données source change (par exemple, suite à l’ajout d’une nouvelle colonne), vous devrez procéder à une actualisation complète de l’extrait avant de pouvoir recommencer à faire des actualisations incrémentielles.

      Suivez les étapes ci-dessous pour configurer un extrait à actualiser progressivement, mais assurez-vous d’abord d’avoir sélectionné Toutes les lignes comme nombre de lignes à extraire. L’actualisation incrémentielle peut uniquement être définie lorsque vous effectuez l’extraction de toutes les lignes de la base de données. Vous ne pouvez pas incrémenter un échantillon d’extrait.

      Cochez la case Actualisation incrémentielle, puis indiquez la table à actualiser et la colonne qui sera utilisée pour identifier les nouvelles lignes. Par exemple, vous pouvez utiliser une colonne de date, de date et heure ou d’ID qui augmente de manière monotone au fur et à mesure que des lignes sont ajoutées à la base de données.

      Développez Paramètres avancés pour définir le mode de récupération des nouvelles lignes.

      Les paramètres avancés vous permettent soit de remplacer les dernières lignes ajoutées par des valeurs actualisées égales ou supérieures à la dernière valeur enregistrée, soit de conserver les dernières lignes ajoutées en actualisant uniquement l’extrait avec les valeurs supérieures à la dernière valeur enregistrée.

      Dans la première approche, Tableau permet aux utilisateurs d’actualiser progressivement les extraits avec une colonne clé non unique telle que la date, la date et l’heure ou l’ID. Cette méthode ajoute une nouvelle étape lors de l’exécution d’une actualisation incrémentielle. Tableau commence par supprimer les lignes de l’extrait qui sont égales à la valeur la plus élevée précédemment observée. Tableau interroge ensuite toutes les lignes supérieures ou égales à la valeur la plus élevée précédente, ce qui récupérera toutes les lignes supprimées et toutes les nouvelles.

      À l’inverse, vous pouvez toujours choisir de ne pas remplacer les dernières lignes ajoutées et d’ajouter uniquement les lignes dont les valeurs sont supérieures à la dernière valeur enregistrée.

      Pour terminer, sélectionnez Créer un extrait.

      Considérations lors d’une actualisation incrémentielle

      Modifier un extrait :

      Si vous modifiez un extrait existant, la dernière actualisation s’affiche. Vous avez ainsi l’assurance de mettre à jour l’extrait avec les données adéquates.

      Actualisation complète :

      Une actualisation complète remplace toutes les lignes par les données de la source de données d’origine chaque fois que vous actualisez l’extrait. Une actualisation complète peut prendre plus de temps et coûter cher à la base de données.

      Moteur de données :

      Le moteur de données, qui est le mécanisme sous-jacent utilisé par Tableau pour créer des extraits, enregistre les valeurs temporelles avec une précision allant jusqu’à 3 décimales. Si vous spécifiez une colonne date/heure ou horodatage pour identifier de nouvelles lignes à l’aide de la colonne, et que votre base de données utilise une précision supérieure à Tableau, vous pouvez vous retrouver avec des lignes en double après une actualisation incrémentielle. Par exemple, si la base de données comporte deux lignes, l’une avec une valeur date/heure de 2015-03-13 17:30:56.502352 et une avec une valeur date/heure de 2015-03-13 17:30:56.502852, Tableau enregistre les deux colonnes en utilisant une valeur date/heure de 2015-03-13 17:30:56.502, créant de ce fait des lignes en double.

      Limites

      • Vous ne pouvez pas créer d’extraits pour des sources de données intégrées faisant référence à des sources de données publiées. Pour contourner ce problème, créez l’extrait directement sur la source de données publiée. Pour plus d’informations, consultez Extraire une source de données publiée sur le serveur de contenu.

      • Vous ne pouvez pas créer d’extraits pour des sources de données basées sur des fichiers. Les sources de données basées sur des fichiers présentent déjà des caractéristiques de performances spéciales et l’ajout de l’extraction n’aura aucun avantage en termes de performances.

      • Cette fonctionnalité ne s’applique pas aux sources de données basées sur Bridge dans Tableau Cloud.

      • Limitation concernant SQL personnalisé : les requêtes SQL personnalisées ne sont pas prises en charge avec les paramètres avancés. Les utilisateurs qui s’appuient sur SQL personnalisé devront adapter leur approche s’ils souhaitent utiliser les paramètres avancés pour une actualisation incrémentielle.

Créer des extraits dans le serveur de contenu

Extraire une source de données publiée sur le serveur de contenu

Volets Sources de données montrant l’option d’extrait dans le menu

Pour extraire une source de données publiée :

  1. Connectez-vous en tant qu’administrateur ou en tant que propriétaire de la source de données.
  2. Dans l’onglet Contenu, sélectionnez Explorer > Sources de données.
  3. Sélectionnez une source de données en cliquant sur le nom de la source de données.
  4. En haut de l’écran, sous le nom Source de données, sélectionnez le menu déroulant affichant En direct.
  5. Modifiez le type de connexion de En direct en Extrait. Si la fonction de cryptage d’extrait au repos est activée sur le site, sélectionnez Crypté ou Non crypté.
  6. Si vous voyez un message d’erreur concernant les informations d’identification intégrées, intégrez vos informations d’identification dans la source de données. Pour ce faire, cliquez sur Modifier la connexion. Sélectionnez « Mot de passe intégré dans la connexion », puis cliquez sur Enregistrer.

Extraire une source de données intégrée sur le serveur de contenu

Option Extrait dans le menu Actions du volet Sources de données

Pour extraire une ou plusieurs sources de données intégrées dans un classeur publié :

  1. Connectez-vous en tant qu’administrateur ou en tant que propriétaire de la source de données.
  2. Accédez au classeur publié.
  3. Accédez à l’onglet Sources de données.
  4. Sélectionnez une ou plusieurs sources de données.
  5. Cliquez sur le bouton Action.
  6. Cliquez sur Extraire. Si la fonction de cryptage d’extrait au repos est activée sur le site, sélectionnez Crypté ou Non crypté.

Limites

  • Vos informations d’identification de connexion doivent être intégrées dans la source de données.
  • Vous ne pouvez pas créer d’extraits pour des sources de données intégrées faisant référence à des sources de données publiées. Pour contourner ce problème, créez l’extrait directement sur la source de données publiée.
  • Vous ne pouvez pas créer d’extraits pour des sources de données basées sur des fichiers. Les sources de données basées sur des fichiers présentent déjà des caractéristiques de performances spéciales et l’ajout de l’extraction n’aura aucun avantage en termes de performances.
  • Cette fonctionnalité ne s’applique pas aux sources de données basées sur Bridge dans Tableau Cloud.

Actualiser les données d’extraits

Une fois les données extraites, vous avez la possibilité de configurer une programmation d’actualisation des extraits afin de garder à jour les données. Pour plus d’informations, consultez Programmer des actualisations sur Tableau Cloud.

Surveiller et gérer les extraits

Les administrateurs de serveurs peuvent surveiller la création d’extraits dans la vue administrative Tâches d’arrière-plan pour les extraits. Pour plus d’informations, consultez Tâches d’arrière-plan pour les extraits.

Les administrateurs de serveur peuvent gérer des extraits dans la page Travaux. Pour plus d’informations, consultez Gestion des travaux d’arrière-plan dans Tableau Cloud.

Merci de vos commentaires !Avis correctement envoyé. Merci