Créer des extraits sur le Web
Vous pouvez extraire vos sources de données sur le Web (sans utiliser Tableau Desktop) pour améliorer les performances de la source de données et prendre en charge des fonctions analytiques supplémentaires. Lorsque vous extrayez votre source de données, Tableau copie les données de votre magasin de données distant sur Tableau Server ou Tableau Cloud. Pour en savoir plus sur les avantages de l’extraction de vos données, consultez Extraire vos données. Sur le Web, vous pouvez créer des extraits pendant que vous êtes dans la création Web ou dans le serveur de contenu.
Créer des extraits dans la création Web
Vous pouvez créer des extraits directement dans la création Web, avec des paramètres d’extraction par défaut.
Extraire une source de données intégrée dans la création Web
Effectuez les étapes suivantes pour créer un extrait dans la création Web.
Conseil : il est recommandé de finaliser votre modèle de données avant de créer l’extrait. La création d’extrait peut prendre beaucoup de temps et toute modification de votre modèle de données, par exemple l’ajout de nouvelles tables logiques, invalidera l’extrait.
- Sélectionnez l’onglet Source de données dans le coin inférieur gauche du volet de création Web. Pour les nouveaux classeurs, vous commencerez dans l’onglet Source de données.
- Dans le coin supérieur droit, modifiez le type de connexion de En direct en Extrait.
- Cliquez sur Créer un extrait. La boîte de dialogue Création d’un extrait s’affiche.
La création d’extrait peut prendre beaucoup de temps et vous pouvez fermer votre session de création pendant ce processus. Pour éviter que votre création d’extrait ne soit pas perdue, dans la boîte de dialogue, cliquez sur M’avertir une fois l’opération terminée afin de spécifier un emplacement d’enregistrement pour le classeur extrait. Si votre extrait réussit, votre classeur sera enregistré à l’emplacement spécifié et vous serez informé que vous pouvez continuer votre session de création Web.
Si votre création d’extrait échoue, vous serez informé que l’extrait n’a pas pu être créé et vous pourrez restaurer vos modifications non enregistrées en rouvrant le classeur d’origine dans la création Web.
Définir vos paramètres d’extrait
Vous pouvez configurer une ou plusieurs des options suivantes pour indiquer à Tableau comment procéder au stockage, définir des filtres et limiter la quantité de données dans votre extrait.
Déterminer le mode de stockage des données d’extrait
Vous pouvez demander à Tableau de stocker les données dans votre extrait en utilisant l’une de ces deux structures (schémas) : tables logiques (schéma dénormalisé) ou tables physiques (schéma normalisé). Pour plus d’informations sur les tables logiques et tables physiques, consultez Modèle de données Tableau. L’option choisie dépend de vos besoins.
Tables logiques
Les tables logiques stockent les données à l’aide d’une table d’extrait pour chaque table logique de la source de données. Les tables physiques qui définissent une table logique sont fusionnées et stockées avec cette table logique. Par exemple, si une source de données était constituée d’une seule table logique, les données seraient stockées dans une seule table.
Si une source de données était composée de trois tables logiques (chacune contenant plusieurs tables physiques), les données d’extrait seraient stockées dans trois tables, une pour chaque table logique.
Sélectionnez Tables logiques pour limiter la quantité de données dans votre extrait avec des propriétés d’extrait supplémentaires comme les filtres d’extrait, l’agrégation, la fonctionnalité N supérieurs ou d’autres fonctionnalités qui nécessitent des données dénormalisées. À utiliser également lorsque vos données utilisent des fonctions directes (RAWSQL). Il s’agit de la structure par défaut que Tableau utilise pour stocker les données d’extrait.
Si vous utilisez cette option lorsque votre extrait contient des liaisons, les liaisons sont appliquées lors de la création de l’extrait.
Tables physiques
Les tables physiques stockent les données à l’aide d’une table d’extrait pour chaque table physique dans la source de données.
Sélectionnez Tables physiques si votre extrait comporte des tables combinées avec une ou plusieurs jointures d’égalité et remplit les conditions d’utilisation de l’option Tables physiques répertoriées ci-dessous. Si vous utilisez cette option, les liaisons sont effectuées au moment de la requête.
Cette option peut potentiellement améliorer les performances et réduire la taille du fichier d’extrait. Pour plus d’informations sur la manière dont Tableau vous recommande d’utiliser l’option Tables physiques, consultez Conseils d’utilisation de l’option Tables physiques dans l’aide de Tableau Desktop.
Dans certains cas, vous pouvez également utiliser cette option comme solution pour la sécurité au niveau des lignes. Pour plus d’informations sur la sécurité au niveau des lignes à l’aide de Tableau, consultez Restreindre l’accès au niveau des lignes de données dans l’aide de Tableau Desktop.
Conditions d’utilisation de l’option Tables physiques
Pour stocker votre extrait à l’aide de l’option Tables physiques, les données de votre extrait doivent remplir toutes les conditions énumérées ci-dessous.
- Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).
- Les types de données des colonnes utilisées pour les relations ou les jointures sont identiques.
- Aucune fonction directe (RAWSQL) n’est utilisée.
- Aucune actualisation incrémentielle n’est configurée.
- Aucun filtre d’extrait n’est configuré.
- Aucune option N premiers ou d’échantillonnage n’est configurée.
- Lorsque l’extrait est stocké sous la forme de tables physiques, vous ne pouvez pas lui ajouter de données.
- Pour les tables logiques, vous ne pouvez pas ajouter des données à des extraits qui contiennent plus d’une table logique.
Remarque : les options Tables logiques et Tables physiques affectent uniquement la manière dont les données de votre extrait sont stockées. Elles n’affectent pas la manière dont les tables de votre extrait s’affichent dans le volet Source de données.
Déterminer la quantité de données à extraire
Sélectionnez Ajouter pour définir un ou plusieurs filtres afin de limiter la quantité de données extraites en fonction de champs et de leurs valeurs.
Agréger les données dans l’extrait
Sélectionnez Agréger les données pour les dimensions visibles pour agréger les mesures à l’aide de leur agrégation par défaut. L’agrégation des données permet de consolider les lignes, de minimiser la taille du fichier d’extrait et d’augmenter les performances.
Lorsque vous choisissez d’agréger les données, vous pouvez également choisir de Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc. Les exemples suivants expliquent comment les données seront extraites pour chaque option d’agrégation disponible.
Données d’origine | Chaque enregistrement apparaît sur une ligne distincte. Vos données contiennent sept lignes. | |
Agréger les données pour les dimensions visibles (pas de regroupement) | Les enregistrements avec la même date et la même région ont été agrégés dans une seule ligne. Votre extrait contient cinq lignes. | |
Agréger les données pour les dimensions visibles (regrouper les dates dans Mois) | Les dates ont été regroupées au niveau Mois et les enregistrements au sein de la même région ont été agrégés dans une seule ligne. Votre extrait contient trois lignes. |
Choisir les lignes à extraire
Sélectionnez le nombre de lignes que vous souhaitez extraire.
Vous pouvez extraire Toutes les lignes ou les lignes N premiers. Tableau applique d’abord les filtres et les agrégations, puis extrait le nombre de lignes des résultats filtrés et agrégés. Les options du nombre de lignes dépendent du type de source de données à partir duquel vous obtenez l’extrait.
Remarques :
- Toutes les sources de données ne prennent pas en charge l’échantillonnage. Il se peut donc que l’option Échantillonnage ne s’affiche pas dans la boîte de dialogue Extraire des données.
- Tous les champs que vous masquez en premier dans la page Source de données ou dans l’onglet de feuille seront exclus de l’extrait.
Configurer les paramètres d’actualisation incrémentielle
La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.
Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez simplement ajouter les nouvelles transactions de chaque jour. Pour disposer d’une option incrémentielle lorsque vous planifiez une actualisation, vous devez d’abord en définir les paramètres ici.
Vous pouvez préférer une actualisation complète pour être sûr de disposer des données les plus récentes.
Remarque : si la structure des données source change (par exemple, suite à l’ajout d’une nouvelle colonne), vous devrez procéder à une actualisation complète de l’extrait avant de pouvoir réexécuter des actualisations incrémentielles.
Configurer l’actualisation incrémentielle
Suivez les étapes ci-dessous pour configurer un extrait à actualiser progressivement, mais assurez-vous d’abord d’avoir sélectionné Toutes les lignes comme nombre de lignes à extraire.
L’actualisation incrémentielle peut uniquement être définie lorsque vous effectuez l’extraction de toutes les lignes de la base de données. Vous ne pouvez pas incrémenter un échantillon d’extrait.
- Sélectionnez la case Actualisation incrémentielle.
- Choisissez une table à actualiser.
- Sélectionnez une colonne à utiliser pour identifier de nouvelles lignes.
- Entrez une plage de sous-dates dans Plage de dates minimale à actualiser. Vous avez la possibilité de choisir une plage horaire spécifique en jours, heures, minutes ou secondes dans ce champ.
Par exemple, lors de la sélection d’une colonne Date ou Date et heure dans Tableau, les utilisateurs peuvent actualiser les données d’extrait dans un délai spécifié, par exemple 14 jours à compter de la date d’actualisation. Cette fonctionnalité est avantageuse pour les sources de données qui permettent des insertions et des modifications rétroactives dans une période de temps définie. En utilisant l’actualisation incrémentielle des extraits, les utilisateurs peuvent capturer efficacement ces modifications ainsi que toutes les nouvelles données.
Utiliser les paramètres avancés
Vous pouvez développer les Paramètres avancés pour définir le mode de récupération des nouvelles lignes.
Remarque : si vous avez défini une plage de dates minimale pour l’actualisation, la fonctionnalité Paramètres avancés ne sera pas accessible.
Les paramètres avancés vous permettent soit de remplacer les dernières lignes ajoutées par des valeurs actualisées égales ou supérieures à la dernière valeur enregistrée, soit de conserver les dernières lignes ajoutées en actualisant uniquement l’extrait avec les valeurs supérieures à la dernière valeur enregistrée.
Dans la première approche, Tableau permet aux utilisateurs d’actualiser progressivement les extraits avec une colonne clé non unique telle que la date, la date et l’heure ou l’ID.
Cette méthode ajoute une nouvelle étape lors de l’exécution d’une actualisation incrémentielle. Tableau commence par supprimer les lignes de l’extrait qui sont égales à la valeur la plus élevée précédemment observée. Tableau interroge ensuite toutes les lignes supérieures ou égales à la valeur la plus élevée précédente, ce qui récupérera toutes les lignes supprimées et toutes les nouvelles.
À l’inverse, vous pouvez toujours choisir de ne pas remplacer les dernières lignes ajoutées et d’ajouter uniquement les lignes dont les valeurs sont supérieures à la dernière valeur enregistrée.
Pour terminer, sélectionnez Créer un extrait.
Considérations lors d’une actualisation incrémentielle
Modifier un extrait :
Si vous modifiez un extrait existant, l’actualisation la plus récente s’affiche. Vous avez ainsi l’assurance de mettre à jour l’extrait avec les données adéquates.
Actualisation complète :
Une actualisation complète remplace toutes les lignes par les données de la source de données d’origine chaque fois que vous actualisez l’extrait. Une actualisation complète peut prendre plus de temps et coûter cher à la base de données.
Moteur de données :
Le moteur de données, qui est le mécanisme sous-jacent utilisé par Tableau pour créer des extraits, enregistre les valeurs temporelles avec une précision allant jusqu’à 3 décimales.
Si vous spécifiez une colonne date/heure ou horodatage pour identifier de nouvelles lignes à l’aide de la colonne, et que votre base de données utilise une précision supérieure à Tableau, vous pouvez vous retrouver avec des lignes en double après une actualisation incrémentielle.
Par exemple, si la base de données comporte deux lignes, l’une avec une valeur date/heure de 2015-03-13 17:30:56.502352 et une avec une valeur date/heure de 2015-03-13 17:30:56.502852, Tableau enregistre les deux colonnes en utilisant une valeur date/heure de 2015-03-13 17:30:56.502, créant de ce fait des lignes en double.
Limites
- Vous ne pouvez pas créer d’extraits pour des sources de données intégrées faisant référence à des sources de données publiées. Pour contourner ce problème, créez l’extrait directement sur la source de données publiée. Pour plus d’informations, consultez Extraire une source de données publiée sur le serveur de contenu.
- Vous ne pouvez pas créer d’extraits pour des sources de données basées sur des fichiers. Les sources de données basées sur des fichiers présentent déjà des caractéristiques de performances spéciales et l’ajout de l’extraction n’aura aucun avantage en termes de performances.
- Cette fonctionnalité ne s’applique pas aux sources de données basées sur Bridge dans Tableau Cloud.
- Limitation concernant SQL personnalisé : les requêtes SQL personnalisées ne sont pas prises en charge avec les paramètres avancés. Les utilisateurs qui s’appuient sur SQL personnalisé devront adapter leur approche s’ils souhaitent utiliser les paramètres avancés pour une actualisation incrémentielle.
Créer des extraits dans le serveur de contenu
Extraire une source de données publiée sur le serveur de contenu
Appliquez la procédure suivante pour extraire une source de données publiée.
- Connectez-vous en tant qu’administrateur ou en tant que propriétaire de la source de données.
- Dans l’onglet Contenu, sélectionnez Explorer, puis Sources de données.
- Sélectionnez une source de données en cliquant sur le nom de la source de données.
- En haut de l’écran, sous le nom Source de données, sélectionnez le menu déroulant affichant En direct.
- Modifiez le type de connexion de En direct en Extrait. Si la fonction de cryptage d’extrait au repos est activée sur le site, sélectionnez Crypté ou Non crypté.
- Si vous voyez un message d’erreur concernant les informations d’identification intégrées, intégrez vos informations d’identification dans la source de données. Pour ce faire, choisissez Modifier la connexion. Sélectionnez « Mot de passe intégré dans la connexion », puis choisissez Enregistrer.
Extraire une source de données intégrée sur le serveur de contenu
Effectuez la procédure suivante pour extraire une ou plusieurs sources de données intégrées dans un classeur publié.
- Connectez-vous en tant qu’administrateur ou en tant que propriétaire de la source de données.
- Accédez au classeur publié.
- Accédez à l’onglet Sources de données.
- Sélectionnez une ou plusieurs sources de données.
- Choisissez le bouton Action.
- Sélectionnez Extraire. Si la fonction de cryptage d’extrait au repos est activée sur le site, sélectionnez Crypté ou Non crypté.
Limites
- Vos informations d’identification de connexion doivent être intégrées dans la source de données.
- Vous ne pouvez pas créer d’extraits pour des sources de données intégrées faisant référence à des sources de données publiées. Pour contourner ce problème, créez l’extrait directement sur la source de données publiée.
- Vous ne pouvez pas créer d’extraits pour des sources de données basées sur des fichiers. Les sources de données basées sur des fichiers présentent déjà des caractéristiques de performances spéciales et l’ajout de l’extraction n’aura aucun avantage en termes de performances.
- Cette fonctionnalité ne s’applique pas aux sources de données basées sur Bridge dans Tableau Cloud.
Actualiser les données d’extraits
Une fois les données extraites, vous avez la possibilité de configurer une programmation d’actualisation des extraits afin de garder à jour les données. Pour plus d’informations, consultez Actualiser des données de manière programmée.
Surveiller et gérer les extraits
Les administrateurs de serveurs peuvent surveiller la création d’extraits dans la vue administrative Tâches d’arrière-plan pour les extraits. Pour plus d’informations, consultez Tâches d’arrière-plan pour les extraits.
Les administrateurs de serveur peuvent gérer des extraits dans la page Travaux. Pour plus d’informations, consultez Gestion des travaux d’arrière-plan dans Tableau Server.
Les travaux de création d’extraits, par exemple les travaux d’actualisation d’extraits, ont une limite de requêtes maximum avant d’expirer. Il s’agit d’empêcher les travaux de fonctionner sans cesse et d’utiliser une quantité illimitée de ressources serveur. Les administrateurs de serveur peuvent configurer le délai d’expiration limite pour les requêtes d’extraits à l’aide du paramètre de configuration de l’interface en ligne de commande TSM backgrounder.querylimit
. Pour plus d’informations, consultez Options tsm configuration set.
Les administrateurs de serveur peuvent gérer la création Web. Pour plus d’informations, consultez Définir l’accès à la création Web et aux fonctions d’un site.