Meilleures pratiques pour les sources de données publiées

La publication de sources de données sur Tableau Online ou Tableau Server est intégrale afin de conserver une source unique pour vos données. La publication permet également de partager des données entre des collègues, y compris ceux qui n'utilisent pas Tableau Desktop, mais sont autorisés à modifier les classeurs dans l'environnement de modification Web.

Les mises à jour d'une source de données publiée sont envoyées à tous les classeurs connectés, que les classeurs soient eux-mêmes publiés ou non.

Composants d'une source de données publiée

Une source de données Tableau se compose des éléments suivants :

Informations de connexion aux données qui décrivent les données que vous souhaitez présenter à Tableau pour les analyser. Lorsque vous vous connectez aux données dans Tableau Desktop, vous pouvez créer des jointures, dont des jointures entre les tables de différents types de données. Vous pouvez renommer les champs du volet Source de données afin qu'ils soient plus descriptifs pour les personnes qui travailleront avec la source de données que vous avez publiée.

Un extrait, si vous décidez d'en créer un. Certaines directives relatives aux circonstances de création d'un extrait sont incluses ci-dessous, ainsi que dans les ressources supplémentaires.

Informations sur l'accès aux données ou leur actualisation. La connexion comprend également des informations d'accès. Ces informations sont notamment :

  • Le chemin d'accès à un fichier Excel d'origine.

  • Des données d'identification intégrées ou des jetons d'accès OAuth pour accéder directement aux données.

  • Ou pas d'informations d'identification afin que les utilisateurs soient invités à les entrer lorsqu'ils veulent accéder aux données (que ce soit pour consulter un classeur qui s'y connecte ou pour y connecter un nouveau classeur).

Pour plus d'informations, consultez Définir les informations d'identification pour accéder à vos données publiées.

Personnalisation et nettoyage qui vous aide, vous et d'autres utilisateurs, à utiliser la source de données de manière efficace. Lorsque vous travaillez avec votre vue, vous pouvez ajouter des calculs, des ensembles, des groupes, des compartiments et des paramètres, définir la mise en forme de champs personnalisés, masquer des champs inutilisés, etc.

Tous ces ajustements deviennent partie intégrante des métadonnées contenues dans la source de données que vous publiez et gérez.

Préparation d'une source de données pour la publication

Lorsque vous publiez la source de données, considérez les meilleures pratiques suivantes :

  • Créez la connexion pour les informations que vous souhaitez présenter dans Tableau et effectuez toute activité de personnalisation et de nettoyage nécessaire pour faciliter l'utilisation de la source de données pour d'autres utilisateurs et vous-même.

  • Le cas échéant, créez un extrait des données que vous souhaitez publier. Pour plus d'informations, consultez la section suivante, À quel moment utiliser un extrait.

  • Développer une convention d'appellation de source de données

    Après avoir publié une source de données, vous ne pouvez pas la renommer directement. Au lieu de cela, vous devez publier une nouvelle copie portant le nouveau nom, puis mettre à jour toutes les connexions de classeur. Une convention d'appellation pertinente peut également aider d'autres utilisateurs de données à déduire à quelle source de données se connecter.

  • Envisagez de désigner les rôles suivants parmi vos utilisateurs Tableau : 

    • Un administrateur (ou une équipe) de données qui crée ou publie les sources de données pour la communauté Tableau, en se conformant aux exigences de données de votre entreprise.

    • Un administrateur de site qui gère le contenu publié, actualise des extraits et définit des autorisations sur le serveur sur lequel vous publiez (Tableau Server ou Tableau Online).

    La gestion centralisée vous aide à éviter la prolifération de source de données. Les auteurs qui se connectent aux données gérées ont l'assurance que les réponses qu'ils y trouvent reflètent l'état actuel de l'activité.

À quel moment utiliser un extrait

Dans les cas suivants, il peut vous être demandé de choisir de publier un extrait plutôt que de vous connecter en direct.

Publication de données sur Tableau Online auxquelles il ne peut pas accéder directement

Tableau Online dans le cloud ne peut pas accéder aux sources de données que vous gérez sur votre réseau local. Selon la connexion, vous pourriez avoir besoin de publier un extrait et de configurer une programmation d'actualisation à l'aide de Tableau Bridge.

Certaines sources de données hébergées sur le cloud requièrent toujours des extraits, notamment Google Analytics, Salesforce.com, Oracle, OData, et certaines sources de données ODBC. Vous pouvez définir des programmations d'actualisation pour certaines de ces sources de données directement sur Tableau Online ; pour d'autres, vous utilisez Tableau Bridge.

Certaines sources de données du connecteur de données Web requièrent toujours des extraits. Si vous vous connectez à la source de données à l'aide de l'authentification standard avec nom et mot de passe de l'utilisateur, vous pouvez l'actualiser à l'aide de Tableau Bridge. Si vous vous connectez à la source de données WDC à l'aide de l'authentification OAuth, vous devrez utiliser une méthode alternative pour l'actualiser.

Pour en savoir plus sur la manière dont Tableau Bridge prend en charge à la fois les connexions aux extraits et les connexions en direct auxquelles Tableau Online ne peut pas accéder directement, consultez Utiliser Tableau Bridge pour développer les options d'actualisation des données dans l'aide de Tableau Online.

Amélioration des performances

Même si le serveur prend en charge les connexions en direct à vos données, un extrait peut être plus pertinent. Par exemple, si la base de données est volumineuse ou que la connexion est lente, vous pouvez extraire un sous-ensemble contenant uniquement les informations pertinentes. L'extrait peut être plus facile et plus rapide à traiter qu'une connexion en direct.

Dans les cas où vous pouvez utiliser une connexion en direct ou un extrait que vous actualisez de manière programmée, vous souhaiterez peut-être découvrir les deux options et déterminer laquelle fonctionne le mieux pour vous.

Activation de fonctions que la source de données ne prend pas en charge de manière inhérente

Vous pouvez par exemple souhaiter utiliser la fonction Médiane avec les données SQL Server.

Pour plus d'informations sur la création d'extraits de données, consultez Extraire vos données.

Publication de données autonomes ou intégrées à des classeurs

Vous pouvez publier des sources de données en tant que ressources autonomes auxquelles les classeurs se connectent, ou publier des classeurs avec les sources de données qui y sont intégrées.

Lorsque vous publiez un classeur, si une connexion indique autre chose qu'une source de données Tableau publiée sur le même projet, les données sont publiées comme faisant partie du classeur (parfois appelé intégré au classeur).

Lorsque les données sont intégrées dans un classeur :

  • L'accès à la source de données est limité au classeur dans lequel vous l'avez publiée. Vous-même ou d'autres utilisateurs ne pouvez pas vous connecter à ces données depuis un autre classeur.

  • Vous pouvez définir des programmations d'actualisation d'extrait comme vous le feriez pour les sources de données que vous publiez séparément.

Chaque mode de publication présente ses avantages. Le tableau ci-dessous décrit quelques points de comparaison. Cette liste n'est pas exhaustive et il s'agit de généralisations. La façon dont les facteurs, dont ceux précités, s'appliquent à votre situation est propre à votre environnement.

Publié séparément. Intégré dans le classeur

La publication de sources de données est également une étape vers la centralisation de la gestion des données. Vous pouvez créer des stratégies visant à minimiser la prolifération de sources de données et à aider les utilisateurs à trouver les données pertinentes pour leur travail en cours.

Chaque source de données intégrée a une connexion de données séparée.

Chacune a le potentiel d'afficher quelque chose de différent par rapport à une autre à tout moment (et la prolifération de source de données est courante).

Conçu pour être partagé ; devient disponible pour que d'autres utilisateurs Tableau puissent s'y connecter.

Les données sont disponibles uniquement dans le classeur ; elles ne sont pas disponibles pour une connexion par les autres utilisateurs Tableau Desktop.

Sans directives de gestion du contenu et de libre service, l'affichage d'une longue liste de sources de données auxquelles se connecter peut être déroutant pour les utilisateurs qui se basent sur les données dans le cadre de leur travail, et est plus difficile à gérer sur le serveur.

Les utilisateurs créent leurs propres connexions, et ils savent exactement quelles données ils obtiennent.

Un utilisateur qui modifie une source de données partagée peut avoir des doutes ou ne pas être conscient des effets que ces modifications ont sur les classeurs connectés.

La modification des données nécessite d'ouvrir le classeur, où vous pouvez voir le résultat de la modification.

Même si les effets des modifications apportées aux sources de données sur les classeurs connectés sont prévus, la mise à jour de ces classeurs connectés est fastidieuse.

Comme ci-dessus. Toutefois, si plusieurs classeurs utilisent des données similaires et ont besoin d'être mis à jour, il peut être utile de se connecter plutôt à une source de données publiée.

Les extraits peuvent être actualisés dans une programmation. Vous devez configurer une seule programmation pour l'extrait. Tous les classeurs qui s'y connectent afficheront toujours les données les plus actualisées.

Les extraits intégrés qui ne peuvent pas être actualisés peuvent être utiles pour afficher les instantanés en temps voulu.

Si vous souhaitez conserver les données actualisées, chaque classeur doit avoir sa propre programmation d'actualisation.

Vous aide généralement à optimiser les performances sur le serveur ou le site.

Les performances peuvent être affectées lorsque le serveur contient plusieurs classeurs qui se connectent aux mêmes données d'origine, et que chaque classeur a sa propre programmation d'actualisation.

Actualisation d'extraits

Lorsque vous publiez une source de données comportant un extrait, vous pouvez l'actualiser de manière programmée. La manière dont vous programmez les actualisations dépend du type de source de données et du fait que vous publiez ou non sur Tableau Server ou Tableau Online.

Pour plus d'informations, consultez les rubriques suivantes : 

Ressources supplémentaires

Décharge de responsabilité : Bien que nous fassions tout notre possible pour que ces liens vers des sites externes soient précis, à jour et pertinents, Tableau ne peut pas garantir la précision ou l'actualisation des pages gérées par des fournisseurs externes. Contactez le site externe pour des réponses aux questions concernant son contenu.

Merci de vos commentaires ! Erreur lors de la soumission de votre commentaire. Réessayez ou envoyez-nous un message.