Meilleures pratiques pour les sources de données publiées
La publication de sources de données sur Tableau Cloud ou Tableau Server est intégrale afin de conserver une source unique pour vos données. La publication permet également de partager des données entre des collègues, y compris ceux qui n’utilisent pas Tableau Desktop, mais sont autorisés à modifier les classeurs dans l’environnement d’édition Web.
Les mises à jour d’une source de données publiée sont envoyées à tous les classeurs connectés, que les classeurs soient eux-mêmes publiés ou non.
Composants d’une source de données publiée
Une source de données Tableau se compose des éléments suivants :
Informations de connexion aux données qui décrivent les données que vous souhaitez présenter à Tableau pour les analyser. Lorsque vous vous connectez aux données dans Tableau Desktop, vous pouvez créer des jointures, dont des jointures entre les tables de différents types de données. Vous pouvez renommer les champs de la page Source de données afin qu’ils soient plus descriptifs pour les personnes qui travailleront avec la source de données que vous avez publiée.
Un extrait, si vous décidez d’en créer un. Certaines directives relatives aux circonstances de création d’un extrait sont incluses ci-dessous, ainsi que dans les ressources supplémentaires.
Informations sur l’accès aux données ou leur actualisation. La connexion comprend également des informations d’accès. Ces informations sont notamment :
Le chemin d’accès à un fichier Excel d’origine.
Des données d’identification intégrées ou des jetons d’accès OAuth pour accéder directement aux données.
Ou pas d’identifiants afin que les utilisateurs soient invités à les entrer lorsqu’ils veulent accéder aux données (que ce soit pour consulter un classeur qui s’y connecte ou pour y connecter un nouveau classeur).
Pour plus d’informations, consultez Définir les informations d’identification pour accéder à vos données publiées.
Personnalisation et nettoyage qui vous aide, vous et d’autres utilisateurs, à utiliser la source de données de manière efficace. Lorsque vous travaillez avec votre vue, vous pouvez ajouter des calculs, des ensembles, des groupes, des compartiments et des paramètres, définir la mise en forme de champs personnalisés, masquer des champs inutilisés, etc.
Tous ces ajustements deviennent partie intégrante des métadonnées contenues dans la source de données que vous publiez et gérez.
Préparation d’une source de données pour la publication
Lorsque vous publiez la source de données, considérez les meilleures pratiques suivantes :
Créez la connexion pour les informations que vous souhaitez présenter dans Tableau et effectuez toute activité de personnalisation et de nettoyage nécessaire pour faciliter l’utilisation de la source de données pour d’autres utilisateurs et vous-même.
Le cas échéant, créez un extrait des données que vous souhaitez publier. Pour plus d’informations, consultez la section suivante, À quel moment utiliser un extrait.
Développer une convention d’appellation de source de données
- Après avoir publié une source de données, vous pouvez la renommer dans Tableau Cloud ou Tableau Server. Pour renommer une source de données publiée, choisissez le menu Plus d’actions à côté du nom de votre source de données. Ensuite, choisissez Renommer et entrez le nouveau nom. Vous pouvez également utiliser l’API REST Mettre à jour la source de données pour renommer une source de données publiée. Veillez à utiliser une convention d’appellation pertinente pour aider d’autres utilisateurs de données à déduire la source de données à laquelle se connecter.
- Lorsqu’une source de données publiée est renommée, tous les classeurs qui utilisent cette source de données utiliseront le nouveau nom une fois la prochaine actualisation de la source de données terminée. Comme pour renommer des classeurs, renommer une source de données publiée n’est pas enregistré dans l’historique des révisions d’une source de données.
- Vous pouvez ajouter et modifier des légendes pour votre source de données, mais la modification de la légende ne modifie pas le nom de la source de données publiée sous-jacente. Si vous modifiez le nom de la source de données publiée sous-jacente, la légende n’est pas mise à jour. Mais ne vous inquiétez pas, la source de données correcte est toujours référencée. Vous verrez le nom de la source de données publiée sous-jacente mis à jour dans l’onglet Source de données.
Envisagez de désigner les rôles suivants parmi vos utilisateurs Tableau :
Un administrateur (ou une équipe) de données qui crée ou publie les sources de données pour la communauté Tableau, en se conformant aux exigences de données de votre entreprise.
Un administrateur de site qui gère le contenu publié, actualise des extraits et définit des autorisations sur le serveur sur lequel vous publiez (Tableau Server ou Tableau Cloud).
La gestion centralisée vous aide à éviter la prolifération de source de données. Les auteurs qui se connectent aux données gérées ont l’assurance que les réponses qu’ils y trouvent reflètent l’état actuel de l’activité.
À quel moment utiliser un extrait
Dans les cas suivants, il peut vous être demandé de choisir de publier un extrait plutôt que de vous connecter en direct.
Publication de données sur Tableau Cloud auxquelles il ne peut pas accéder directement
Tableau Cloud dans le nuage ne peut pas accéder aux sources de données que vous gérez sur votre réseau local. Selon la connexion, vous pourriez avoir besoin de publier un extrait et de configurer une programmation d’actualisation à l’aide de Tableau Bridge.
Certaines sources de données dans le nuage requièrent toujours des extraits, notamment Google Analytics, Salesforce.com, Oracle, OData, et certaines sources de données ODBC. Vous pouvez définir des programmations d’actualisation pour certaines de ces sources de données directement sur Tableau Cloud; pour d’autres, vous utilisez Tableau Bridge.
Certaines sources de données du connecteur de données Web requièrent toujours des extraits. Si vous vous connectez à la source de données à l’aide de l’authentification standard avec nom et mot de passe de l’utilisateur, vous pouvez l’actualiser à l’aide de Tableau Bridge. Si vous vous connectez à la source de données WDC à l’aide de l’authentification OAuth, vous devrez utiliser une méthode alternative pour l’actualiser.
Pour en savoir plus sur la manière dont Tableau Bridge prend en charge à la fois les connexions aux extraits et les connexions en direct auxquelles Tableau Cloud ne peut pas accéder directement, consultez Utiliser Tableau Bridge pour développer les options d’actualisation des données(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Cloud.
Amélioration des performances
Même si le serveur prend en charge les connexions en direct à vos données, un extrait peut être plus pertinent. Par exemple, si la base de données est volumineuse ou que la connexion est lente, vous pouvez extraire un sous-ensemble contenant uniquement les informations pertinentes. L’extrait peut être plus facile et plus rapide à traiter qu’une connexion en direct.
Dans les cas où vous pouvez utiliser une connexion en direct ou un extrait que vous actualisez de manière programmée, vous souhaiterez peut-être découvrir les deux options et déterminer laquelle fonctionne le mieux pour vous.
Activation de fonctions que la source de données ne prend pas en charge de manière inhérente
Vous pouvez par exemple souhaiter utiliser la fonction Médiane avec les données SQL Server.
Pour plus d’informations sur la création d’extraits de données, consultez Extraire vos données.
Publication de données autonomes ou intégrées à des classeurs
Vous pouvez publier des sources de données en tant que ressources autonomes auxquelles les classeurs se connectent, ou publier des classeurs avec les sources de données qui y sont intégrées.
Lorsque vous publiez un classeur, si une connexion indique autre chose qu’une source de données Tableau publiée sur le même projet, les données sont publiées comme faisant partie du classeur (parfois appelé intégré au classeur).
Lorsque les données sont intégrées dans un classeur :
L’accès à la source de données est limité au classeur dans lequel vous l’avez publiée. Vous-même ou d’autres utilisateurs ne pouvez pas vous connecter à ces données depuis un autre classeur.
Vous pouvez définir des programmations d’actualisation d’extrait comme vous le feriez pour les sources de données que vous publiez séparément.
Chaque mode de publication présente ses avantages. Le tableau ci-dessous décrit quelques points de comparaison. Cette liste n’est pas exhaustive et il s’agit de généralisations. La façon dont les facteurs, dont ceux précités, s’appliquent à votre situation est propre à votre environnement.
Publié séparément. | Intégré dans le classeur |
---|---|
La publication de sources de données est également une étape vers la centralisation de la gestion des données. Vous pouvez créer des stratégies visant à minimiser la prolifération de sources de données et à aider les utilisateurs à trouver les données pertinentes pour leur travail en cours. | Chaque source de données intégrée a une connexion de données séparée. Chacune a le potentiel d’afficher quelque chose de différent par rapport à une autre à tout moment (et la prolifération de source de données est courante). |
Conçu pour être partagé ; devient disponible pour que d’autres utilisateurs Tableau puissent s’y connecter. | Les données sont disponibles uniquement dans le classeur ; elles ne sont pas disponibles pour une connexion par les autres utilisateurs Tableau Desktop. |
Sans directives de gestion du contenu et de libre service, l’affichage d’une longue liste de sources de données auxquelles se connecter peut être déroutant pour les utilisateurs qui se basent sur les données dans le cadre de leur travail, et est plus difficile à gérer sur le serveur. | Les utilisateurs créent leurs propres connexions, et ils savent exactement quelles données ils obtiennent. |
Un utilisateur qui modifie une source de données partagée peut avoir des doutes ou ne pas être conscient des effets que ces modifications ont sur les classeurs connectés. | La modification des données nécessite d’ouvrir le classeur, où vous pouvez voir le résultat de la modification. |
Même si les effets des modifications apportées aux sources de données sur les classeurs connectés sont prévus, la mise à jour de ces classeurs connectés est fastidieuse. | Comme ci-dessus. Toutefois, si plusieurs classeurs utilisent des données similaires et ont besoin d’être mis à jour, il peut être utile de se connecter plutôt à une source de données publiée. |
Les extraits peuvent être actualisés dans une programmation. Vous devez configurer une seule programmation pour l’extrait. Tous les classeurs qui s’y connectent afficheront toujours les données les plus actualisées. | Les extraits intégrés qui ne peuvent pas être actualisés peuvent être utiles pour afficher les instantanés en temps voulu. Si vous souhaitez conserver les données actualisées, chaque classeur doit avoir sa propre programmation d’actualisation. |
Vous aide généralement à optimiser les performances sur le serveur ou le site. | Les performances peuvent être affectées lorsque le serveur contient plusieurs classeurs qui se connectent aux mêmes données d’origine, et que chaque classeur a sa propre programmation d’actualisation. |
Actualisation d’extraits
Lorsque vous publiez une source de données comportant un extrait, vous pouvez l’actualiser de manière programmée. La manière dont vous programmez les actualisations dépend du type de source de données et du fait que vous publiez ou non sur Tableau Server ou Tableau Cloud.
Pour plus d’informations, consultez les rubriques suivantes :
Mettre les données à jour(Le lien s’ouvre dans une nouvelle fenêtre) sur Tableau Cloud
Mettre les données à jour(Le lien s’ouvre dans une nouvelle fenêtre) sur Tableau Server
Ressources supplémentaires
Présentation des extraits de données Tableau(Le lien s’ouvre dans une nouvelle fenêtre)
Série en trois parties indépendante des versions, par Gordon Rose sur le blogue de Tableau. Elle inclut une présentation approfondie de la structure des fichiers d’extrait, des recommandations sur les conditions d’utilisation des extraits et des meilleures pratiques.
O Extract, Where Art Thou?(Le lien s’ouvre dans une nouvelle fenêtre) et TDE or Live? Quans utiliser des extraits de données Tableau (ou non)(Le lien s’ouvre dans une nouvelle fenêtre)
Articles du visionnaire Tableau Jonathan Drummey sur son blogue Drawing with Numbers. Inclut des conseils concernant les extraits, explique les différents types de fichiers, décrit différents scénarios de publication. (Lire également les commentaires).
Tableau Extracts–What / Why / How etc(Le lien s’ouvre dans une nouvelle fenêtre)
Issu du blogue maintenu par Information Lab, un partenaire Gold Tableau.
Décharge de responsabilité : Bien que nous fassions tout notre possible pour que ces liens vers des sites externes soient précis, à jour et pertinents, Tableau ne peut pas garantir la précision ou l’actualité des pages gérées par des fournisseurs externes. Contactez le site externe pour des réponses aux questions concernant son contenu.