La gouvernance avec Tableau
Ce contenu fait partie de Tableau Blueprint, un cadre de maturité qui vous permet de réaliser une évaluation approfondie et d’améliorer la manière dont votre organisation utilise les données pour générer un impact. Pour commencer votre parcours, répondez aux questions de notre évaluation(Le lien s’ouvre dans une nouvelle fenêtre).
La gouvernance avec Tableau est une étape essentielle pour favoriser l'utilisation et l'adoption de l'analytique, tout en garantissant la sécurité et l'intégrité des données. Vous devez définir des normes, des processus et des politiques pour gérer les données et le contenu en toute sécurité par le biais d'un workflow analytique moderne. De même, il est essentiel que tous les intervenants comprennent et acceptent un tel workflow, pour permettre aux utilisateurs de faire confiance à l'analytique qu'ils utilisent pour prendre des décisions basées sur les données.
Pour définir les Modèles de gouvernance Tableau de votre entreprise, vous devez axer votre travail sur les aspects soulignés dans le diagramme ci-dessous en utilisant le Planificateur Tableau Blueprint.
Gouvernance des données avec Tableau
L'objectif de la gouvernance des données dans un Workflow analytique moderne est de garantir que les données adéquates sont disponibles pour les utilisateurs de l'entreprise qui en ont besoin, au moment où ils en ont besoin. Elle établit des niveaux de responsabilité et facilite l'accès à des contenus approuvés et sécurisés pour les utilisateurs de tous niveaux de compétence.
Gestion des sources de données
La gestion des sources de données inclut les processus liés à la sélection et à la distribution des données dans votre entreprise. Tableau vous permet de vous connecter à vos plates-formes professionnelles de gestion des données, et tire parti de la gouvernance que vous avez mise en place pour ces systèmes. Dans un environnement en libre-service, les auteurs de contenu et les gestionnaires de données ont la possibilité de se connecter à différentes sources de données, ainsi que de créer et publier des sources de données, des classeurs et d'autres types de contenu. Sans ces processus, les sources de données dupliquées se multiplient, ce qui crée une certaine confusion chez les utilisateurs, augmente le risque d'erreurs et entraîne une utilisation inutile des ressources du système.
L'architecture de données hybride de Tableau propose deux manières d'interagir avec les données : par requête en direct ou à l'aide d'un extrait en mémoire. Vous pouvez facilement basculer entre ces deux modes en sélectionnant l'option correspondant à votre cas d'utilisation. Dans les deux cas, les utilisateurs peuvent se connecter aux tables de vos entrepôts de données, aux vues et aux procédures stockées, pour en tirer parti sans intervention supplémentaire.
Les requêtes en direct sont idéales si vous avez investi dans une base de données rapide, si vous avez besoin de données à jour à la minute près ou si vous utilisez le SQL initial. Les extraits en mémoire doivent être utilisés si votre base de données ou votre réseau sont trop lents pour les requêtes interactives, pour réduire la charge supportée par les bases de données transactionnelles ou lorsqu'un accès à des données hors connexion est nécessaire.
Grâce à la prise en charge d'une nouvelle couche logique multi-tables et des relations dans Tableau 2020.2, les utilisateurs ne sont plus limités à l'utilisation de données venant d'une table unique, plate et dénormalisée dans une source de données Tableau. Ils peuvent désormais créer des sources de données multi-tables avec des relations entre tables flexibles et sensibles au niveau de détail, sans avoir à spécifier des types de jointures à l'avance par rapport aux questions qui pourraient être posées. Avec la prise en charge multi-tables, les sources de données Tableau peuvent désormais représenter directement des modèles de données d'entreprise comme les schémas en étoile et en flocon, ainsi que d'autres modèles plus complexes. Une source de données unique prend en charge plusieurs niveaux de détail, ce qui fait que le nombre de sources de données nécessaires pour représenter les mêmes données sera alors réduit. Les relations sont plus flexibles que les jointures de bases de données, et peuvent prendre en charge les cas d'utilisation supplémentaires le cas échéant, réduisant ainsi la nécessité de créer de nouveaux modèles de données pour répondre à de nouvelles questions. L'utilisation de relations dans les schémas correctement modélisés permet de réduire le temps passé à créer un nouveau modèle de données, ainsi que le nombre de sources de données nécessaires pour répondre aux questions métier. Pour en savoir plus, consultez la rubrique Gestion des métadonnées plus bas dans cette section, ainsi que la page Modèle de données Tableau.
Lors de la publication d'un classeur sur Tableau Server ou Tableau Cloud, son auteur peut choisir de publier la source de données ou de l'intégrer au classeur. Cette décision est gouvernée par les processus de gestion des sources de données que vous définissez. Avec le serveur de données Tableau, qui est un composant intégré à la plate-forme Tableau, vous pouvez partager et réutiliser les modèles de données, sécuriser la manière dont vos utilisateurs accèdent aux données, et gérer et consolider les extraits avec les sources de données publiées. Par ailleurs, les sources de données publiées permettent aux utilisateurs ayant des licences Tableau Creator et Explorer d'accéder à des données sécurisées et fiables dans Tableau, pour la création Web et pour la fonctionnalité Parlez aux données. Pour en savoir plus, consultez les pages Meilleures pratiques pour les sources de données publiées, Modifier des vues Tableau sur le Web et Optimiser les données pour la fonctionnalité « Parlez aux données » (Ask Data).
Grâce à des fonctionnalités de découverte des données améliorées, Tableau Catalog indexe tout le contenu, y compris les classeurs, les sources de données et les flux, pour permettre aux auteurs de rechercher des champs, des colonnes, des bases de données et des tables dans les classeurs et les sources de données publiées. Pour en savoir plus, consultez la rubrique sur Data Management.
Lorsque Tableau Catalog est activé, les auteurs de contenu peuvent Rechercher des données en sélectionnant des éléments dans Sources de données, Bases de données, et fichiers ou Tables et objets pour vérifier si des données existent déjà dans Tableau Server et Tableau Cloud, et ainsi réduire les risques de duplication des sources de données.
Par ailleurs, l'onglet Détails des données des vues publiées dans Tableau Server et Tableau Cloud donne aux utilisateurs des informations sur les données que celles-ci utilisent. Il s'agit notamment d'informations sur le classeur (nom, auteur, date de modification), des sources de données utilisées dans la vue, ou encore une liste des champs utilisés.
Pour les gestionnaires de données qui créent des sources de données publiées, le workflow ci-dessous présente les deux aspects majeurs ayant un impact sur la façon dont les sources de données seront gérées : à partir de données en direct ou d'un extrait, et de données intégrées ou partagées. Cela ne signifie pas qu'il est obligatoire d'appliquer un processus de modélisation formel avant de commencer l'analyse.
Pour découvrir les sources de données clés et déterminer leur priorité, utilisez les onglets Enquête données et analytique de Tableau et Cas d'utilisation et sources de données Tableau du Planificateur Tableau Blueprint.
Considérations clés en matière de gestion des sources de données
- Quelles sont les sources de données clés pour les services et les équipes ?
- Qui est le gestionnaire ou le propriétaire des données ?
- Utiliserez-vous des connexions en direct ou des extraits ?
- Les sources de données doivent-elles être intégrées ou publiées ?
- Un ensemble de données a-t-il des variantes ? Si oui, est-il possible de les consolider pour créer une source de référence ?
- Si plusieurs sources de données sont consolidées, les performances et l'utilité de cette source unique sont-elles impactées si elle est utilisée dans de nombreux cas d'utilisation en même temps ?
- Quelles sont les questions métier auxquelles la source de données doit permettre de répondre ?
- Quelles sont les conventions d'attribution des noms des sources de données publiées ?
Qualité des données
La qualité des données mesure la capacité des données à atteindre leurs objectifs dans un contexte particulier, à savoir la prise de décisions métier. La qualité est déterminée par plusieurs facteurs, comme la précision, l'exhaustivité, la fiabilité, la pertinence et l'exactitude. Vous avez certainement déjà mis en place des processus pour mesurer la qualité des données ingérées depuis les systèmes source. Plus la qualité est soumise à un contrôle strict en amont, moins les données devront être corrigées au moment de leur analyse. Vous devez vous assurer que les données conservent le même niveau de qualité jusqu'à ce qu'elles soient utilisées.
Dans votre planification, il peut être utile de passer en revue les contrôles qualité en amont, car les données seront mises à disposition d'un plus grand nombre d'utilisateurs dans le cadre d'un modèle en libre-service. Par ailleurs, Tableau Prep Builder et Tableau Desktop permettent de détecter efficacement les problèmes de qualité des données. Mettez en place un processus permettant de signaler les problèmes de qualité à l'équipe IT ou au gestionnaire des données pour faire de la qualité des données un élément essentiel dans vos initiatives pour améliorer la fiabilité de vos données.
Avec Tableau Data Management et Tableau Catalog, vous pouvez communiquer sur les problèmes de qualité des données avec vos utilisateurs pour renforcer la visibilité et la fiabilité de vos données. Lorsqu'un problème est présent, vous pouvez configurer un message d'avertissement sur une ressource particulière pour que les personnes qui l'utilisent soient averties de l'existence de problèmes. Par exemple, vous pouvez choisir d'avertir les utilisateurs que les données n'ont pas été actualisées depuis deux semaines, ou que la source de données est devenue obsolète. Vous pouvez configurer un avertissement sur la qualité des données par ressource de données, par exemple une source de données, une base de données, un flux ou une table. Pour en savoir plus, consultez la rubrique Définir un avertissement sur la qualité des données, qui inclut les types suivants : Avertissement, Obsolète, Données périmées et En cours de maintenance.
Vous pouvez également définir un avertissement sur la qualité des données à l'aide de l'API REST. Pour en savoir plus, consultez la rubrique Add Data Quality Warning (en anglais) dans l'aide de l'API REST Tableau.
Considérations clés en matière de qualité des données
- Quels sont les processus en place pour garantir la précision, l'exhaustivité, la fiabilité et la pertinence des données ?
- Avez-vous mis en place une liste de contrôle pour rendre le processus opérationnel ?
- Qui a besoin de passer les données en revue avant qu'elles ne soient partagées et considérées comme dignes de confiance ?
- Votre processus peut-il être adapté à des utilisateurs métier, et ceux-ci sont-ils en mesure de collaborer avec les propriétaires des données pour signaler les problèmes ?
Enrichissement et préparation
L'enrichissement et la préparation comprennent les processus utilisés pour améliorer, affiner ou préparer les données brutes en vue de leur analyse. Bien souvent, une source de données unique n'est pas suffisante pour répondre à toutes les questions d'un utilisateur. L'ajout de données issues de différentes sources permet de donner davantage de contexte. Vous avez probablement mis en place des processus ETL pour nettoyer, combiner, agréger et stocker les données lors de l'ingestion de données brutes issues de sources différentes. Grâce aux interfaces en ligne de commande et aux API, Tableau s'intègre à vos processus existants.
Pour la préparation des données en libre-service, vous devez utiliser Tableau Prep Builder et Tableau Prep Conductor pour combiner plusieurs sources de données et automatiser les actions de manière programmée. Tableau Prep propose plusieurs formats de fichiers pour la publication vers Tableau Server ou Tableau Cloud, y compris CSV, Hyper et TDE (versions 2024.2 ou antérieures) ou les sources de données publiées. Depuis Tableau 2020.3, Tableau Prep peut publier des tables de base de données, et le résultat d'un flux peut être enregistré dans une table de base de données relationnelle. Cela signifie que les données préparées de Tableau Prep Builder peuvent être stockées et gérées dans un emplacement centralisé, puis être utilisées dans l'ensemble de votre organisation. Tableau Prep Builder est inclus dans la licence Tableau Creator, tandis que Tableau Prep Conductor fait partie de Tableau Data Management. Tableau Data Management facilite la gestion des données dans votre environnement analytique, de la préparation jusqu'au catalogage, en passant par la recherche et la gouvernance, de sorte que la prise de décision s'appuie systématiquement sur des données à jour et fiables.
Grâce à un feedback visuel, intelligent et direct à chaque étape, Tableau Prep Builder permet aux utilisateurs de tester des prototypes et de préparer des sources de données disparates pour les analyser. Une fois que les étapes sont définies et vérifiées, le flux doit être publié vers Tableau Server et Tableau Cloud, où Tableau Prep Conductor pourra l'exécuter et permettre de créer une source de données publiée de manière programmée. L'automatisation permet de créer un processus cohérent, réduit les étapes manuelles pouvant être sources d'erreurs, garantit le suivi des opérations réussies et des échecs, et permet de gagner du temps. Les utilisateurs peuvent faire confiance au résultat obtenu car les étapes peuvent être visualisées dans Tableau Server ou Tableau Cloud.
Flux Tableau Prep
Flux Tableau Prep dans Tableau Server ou Tableau Cloud.
Considérations clés en matière d'enrichissement des données
- L'enrichissement et la préparation des données seront-ils centralisés ou en libre-service ?
- Quels sont les rôles habilités à effectuer l'enrichissement et la préparation des données ?
- Quels processus et outils ETL doivent être utilisés pour automatiser l'enrichissement et/ou la préparation des données ?
- Quelles sources de données fournissent un contexte pertinent lorsqu'elles sont combinées ?
- Quel est le degré de complexité des sources de données à combiner ?
- Les utilisateurs seront-ils en mesure d'utiliser Tableau Prep Builder et/ou Tableau Desktop pour combiner des ensembles de données ?
- Des champs standardisés pour les jointures ou les combinaisons ont-ils été définis par l'administrateur de la base de données pour permettre aux utilisateurs d'enrichir et de préparer des ensembles de données ?
- Comment faciliterez-vous la préparation des données en libre-service ?
Sécurité des données
La sécurité des données est primordiale pour toute entreprise. Tableau permet aux clients de tirer parti des infrastructures de sécurité existantes pour les données. Plusieurs choix s'offrent aux administrateurs IT pour sécuriser la base de données : par le biais de l'authentification sur la base de données, dans Tableau grâce aux autorisations, ou par une approche hybride. La sécurité est appliquée quel que soit le mode d'accès aux données : depuis des vues publiées sur Internet, sur appareils mobiles ou par le biais de Tableau Desktop et de Tableau Prep Builder. Les clients choisissent souvent une approche hybride pour sa capacité à gérer facilement différents cas d'utilisation. Commencez par établir une classification de la sécurité des données pour définir les différents types de données et les niveaux de sensibilité dans votre entreprise.
La méthode d'authentification à la base de données joue un rôle essentiel dans la sécurisation des bases de données. Ce processus d'authentification est différent de celui de Tableau Server ou de Tableau Cloud : lorsqu'un utilisateur se connecte à Tableau Server ou Tableau Cloud, il n'est pas encore connecté à la base de données. Ainsi, pour que les mesures de sécurité au niveau des bases de données soient appliquées, les utilisateurs de Tableau Server et de Tableau Cloud doivent également disposer d'identifiants (nom d'utilisateur/mot de passe individuels ou de compte de service) pour se connecter aux bases de données. Pour renforcer la protection des données, Tableau a besoin uniquement d'identifiants pour un accès en lecture sur la base de données. Ainsi, les publicateurs ne peuvent pas modifier par erreur les données sous-jacentes. Dans certains cas, vous pouvez également autoriser un utilisateur d'une base de données à créer des tables temporaires. Cela peut renforcer à la fois votre sécurité et vos performances, les données temporaires étant stockées dans la base de données et non dans Tableau. Pour Tableau Cloud, vous devez intégrer les identifiants afin d'actualiser automatiquement les informations de connexion pour la source de données. Pour les sources de données Google et Salesforce.com, vous pouvez intégrer les identifiants sous la forme de jetons d'accès OAuth 2.0.
La fonctionnalité de chiffrement des extraits de données au repos vous permet de chiffrer les extraits .hyper lorsqu'ils sont stockés dans Tableau Server. Les administrateurs de Tableau Server peuvent appliquer le cryptage de tous les extraits de leur site ou permettre aux utilisateurs de spécifier le cryptage de tous les extraits associés à des classeurs ou des sources de données publiés spécifiques. Pour plus d'informations, consultez la rubrique Cryptage d'extrait au repos.
Si votre entreprise déploie le chiffrement des extraits de données au repos, vous avez la possibilité de configurer Tableau Server pour qu'il utilise AWS comme système de gestion des clés (KMS) dans le cadre du chiffrement des extraits. Pour activer AWS KMS ou Azure KMS, vous devez déployer Tableau Server dans AWS ou Azure respectivement, et disposer d'une licence Advanced Management pour Tableau Server. Dans un scénario avec AWS, Tableau Server utilise la clé principale du client d'AWS KMS (CMK) pour générer une clé de données AWS. Tableau Server utilise la clé de données AWS comme clé racine principale pour tous les extraits chiffrés. Dans le scénario Azure, Tableau Server utilise Azure Key Vault pour chiffrer la clé RMK (root master key, ou clé racine principale) pour tous les extraits chiffrés. Néanmoins, même avec une configuration pour une intégration AWS KMS ou Azure, le keystore Java natif et le service KMS local sont toujours utilisés pour le stockage sécurisé des secrets dans Tableau Server. AWS KMS ou Azure KMS servent uniquement à chiffrer la clé racine principale pour les extraits chiffrés. Pour en savoir plus, consultez la rubrique Système de gestion des clés.
Pour Tableau Cloud, toutes les données sont chiffrées au repos par défaut. Advanced Management pour Tableau Cloud permet néanmoins de contrôler davantage la rotation des clés et l'audit en tirant parti de clés de chiffrement gérées par les clients. Les clés de chiffrement gérées par les clients garantissent un niveau de sécurité supplémentaire en vous permettant de chiffrer les extraits de données de votre site avec une clé spécifique, gérée par les clients. L’instance Salesforce Key Management System (KMS) stocke la clé de chiffrement spécifique au site par défaut pour toute personne qui active le chiffrement sur un site. Le processus de chiffrement suit une approche hiérarchique. Tout d'abord, Tableau Cloud chiffre un extrait. Ensuite, Tableau Cloud KMS vérifie ses caches pour trouver une clé adaptée. Si aucune clé n'est trouvée, une clé est générée par l'API KMS GenerateDataKey en utilisant l'autorisation accordée par la politique associée à la clé. AWS KMS utilise la CMK pour générer une clé et renvoie une copie en texte brut et une copie chiffrée vers Tableau Cloud. Tableau Cloud utilise la copie en texte brut de la clé et stocke la copie chiffrée avec les données chiffrées.
Dans Tableau Server et Tableau Cloud, vous pouvez restreindre l'accès aux données en définissant des filtres utilisateur sur les sources de données. Ainsi, vous pouvez mieux contrôler les données auxquelles les utilisateurs ont accès dans une vue publiée, en fonction de leur compte de connexion à Tableau Server. Grâce à cette technique, une directrice régionale peut accéder aux données concernant la région dont elle a la charge, mais pas celles des autres régions. En combinant ces méthodes, vous pouvez publier une vue ou un tableau de bord unique afin de permettre à un large éventail d'utilisateurs de Tableau Cloud ou Tableau Server de consulter et d'analyser des données personnalisées et sécurisées. Pour en savoir plus, consultez les pages Sécurité des données et Restreindre l'accès au niveau des lignes de données. Si la sécurité au niveau des lignes est essentielle dans votre scénario analytique, Tableau Data Management vous permet de tirer parti des connexions virtuelles avec des politique d'utilisation des données pour mettre en place le filtrage utilisateur à grande échelle. Pour en savoir plus, consultez la page À propos des connexions virtuelles et des politiques des données.
Considérations clés en matière de sécurité des données
- Comment classez-vous les différents types de données en fonction de leur niveau de sensibilité ?
- Comment un utilisateur demande-t-il à avoir accès aux données ?
- Appliquerez-vous un système de sécurité avec un compte de service ou au niveau de la base de données pour vous connecter aux données ?
- Quelle est l'approche adéquate pour sécuriser les données en fonction du classement des niveaux de sensibilité ?
- La sécurité de vos données est-elle conforme à la législation, aux normes de conformité et à la réglementation applicables ?
Gestion des métadonnées
La gestion des métadonnées inclut les politiques et les processus qui garantissent de pouvoir accéder aux données, les partager, les analyser et les entretenir à l'échelle de l'entreprise, comme une extension de la gestion des sources de données. Les métadonnées sont une représentation conviviale des données en termes simples, à la manière d'une couche sémantique dans les plates-formes BI traditionnelles. Les sources de données ayant subi une curation occultent la complexité de l'architecture de données moderne de votre entreprise, et rendent les champs immédiatement compréhensibles, quels que soient le magasin de données et la table desquels ils proviennent.
Tableau utilise un système de métadonnées simple, élégant et puissant qui offre une certaine flexibilité aux utilisateurs tout en permettant la gestion des métadonnées de l'entreprise. Le modèle de données Tableau peut être incorporé dans un classeur ou géré de manière centralisée en tant que source de données publiée grâce au serveur de données. Une fois que vous avez établi la connexion aux données et créé le modèle de données Tableau, qui deviendra ensuite une source de données publiée sur Tableau Server ou Tableau Cloud, mettez-vous à la place de vos utilisateurs et imaginez comme l'analytique sera plus facile lorsqu'ils disposeront d'un point de départ bien organisé et filtré, avec une taille adaptée aux questions métier auxquelles il permet de répondre. Pour en savoir plus sur les sources de données publiées, consultez les pages Modèle de données Tableau, Meilleures pratiques pour les sources de données publiées et L'accès à des données gouvernées grâce au serveur de données Tableau.
Le diagramme ci-dessous montre le rôle de chaque élément dans le modèle de données Tableau :
À partir de Tableau 2020.2, la source de données inclut la connexion, les attributs de connexion et les couches physique et logique dans un modèle de données. Lors de la connexion, Tableau définit automatiquement les champs comme étant des dimensions ou des mesures. De plus, le modèle de données stocke les calculs, les alias et la mise en forme. La couche physique inclut les tables physiques définies par les jointures, les unions et/ou le SQL personnalisé. Chaque groupe d'une ou de plusieurs tables physiques définit une table logique, qui réside dans la couche logique avec les relations.
Les relations sont une nouvelle manière plus flexible de modéliser les données que les jointures. Une relation décrit la manière dont deux tables sont liées, en fonction de champs en commun, mais ne combine pas les tables comme une jointure. Les relations offrent plusieurs avantages par rapport aux jointures.
- Vous n'avez pas besoin de configurer les types de jointure entre les tables. Il vous suffit de sélectionner les champs pour définir la relation.
- Les relations utilisent des jointures, mais elles sont automatiques. Les relations retardent la sélection des types de jointures, qui sera effectuée selon l'analyse.
- Tableau utilise les relations pour générer automatiquement des agrégations correctes et des jointures appropriées lors de l'analyse, en fonction du contexte actuel des champs utilisés dans une feuille de calcul.
- Plusieurs tables à différents niveaux de détail sont prises en charge dans une seule source de données, si bien qu’il faut moins de sources de données pour représenter les mêmes données.
- Les valeurs de mesures sans correspondances ne sont pas abandonnées (pas de perte accidentelle de données).
- Tableau génère des requêtes uniquement pour les données qui sont pertinentes pour la vue actuelle.
Lors de l'exécution dans le modèle VizQL, plusieurs requêtes sont créées de manière dynamique en fonction des dimensions et mesures de la visualisation, et des filtres, agrégations et calculs de table sont appliqués. Tableau utilise les informations contextuelles de la table logique distincte pour déterminer les jointures qui sont appliquées pour fournir la bonne agrégation. Ainsi, un utilisateur peut concevoir la source de données sans avoir besoin de savoir, planifier ni même justifier toutes les variations dans les analyses réalisées par d'autres utilisateurs avec la source de données. Tableau Catalog découvre et indexe tout le contenu sur Tableau, y compris les classeurs, les sources de données, les feuilles de calcul et les flux.
Les gestionnaires de données ou les auteurs avec un accès direct aux sources de données doivent créer des prototypes de sources de données intégrées dans un classeur Tableau, puis créer une source de données publiée dans Tableau pour partager le modèle de données dont la curation a été effectuée, comme indiqué ci-dessous dans le workflow pour l'accès direct :
Si les auteurs n'ont pas d'accès direct aux sources de données, un administrateur de base de données ou un gestionnaire de données pourra leur fournir un prototype de source de données embarquée dans un classeur Tableau. Après avoir passé le prototype en revue pour vérifier qu'il contient les données nécessaires, un administrateur de site ou responsable de projet pourra créer une source de données publiée dans Tableau pour partager le modèle de données Tableau, comme indiqué ci-dessous dans le workflow pour l'accès restreint :
La liste de contrôle des métadonnées présente les meilleures pratiques pour effectuer la curation d'une source de données publiée. En définissant des normes à l'aide de cette liste, vous pourrez mettre en place un accès aux données en libre-service sous gouvernance dans l'entreprise, à la fois convivial et facile à comprendre. Avant de créer un extrait ou une source de données publiée dans Tableau, passez en revue cette liste et appliquez-la au modèle de données Tableau :
- Valider le modèle de données
- Filtrer et dimensionner en fonction de l'analyse requise
- Utiliser des conventions d'attribution de noms standard et conviviales
- Ajouter des synonymes pour les noms des champs et des suggestions personnalisées pour Parlez aux données
- Créer des hiérarchies (chemins d'exploration)
- Définir les types de données
- Appliquer la mise en forme (dates, nombres)
- Définir la date de début de l'exercice, le cas échéant
- Ajouter de nouveaux calculs
- Supprimer les calculs en double/de test
- Saisir les descriptions de champ sous forme de commentaires
- Agréger au niveau le plus élevé
- Masquer les champs inutilisés
À partir de la version 2019.3, dans Data Management, Tableau Catalog découvre et indexe tout le contenu dans Tableau, y compris les classeurs, les sources de données, les feuilles de calcul et les flux. L'indexation permet de collecter des informations sur les métadonnées, les schémas et le lignage du contenu. Ensuite, à partir des métadonnées, Tableau Catalog identifie toutes les bases de données, tous les fichiers et toutes les tables utilisés par le contenu sur le site Tableau Server ou Tableau Cloud. Pour faire confiance aux données, il est indispensable de connaître leur provenance. De même, le fait de savoir qui les utilise vous permet d'analyser l'impact des modifications apportées à ces données dans votre environnement. La fonctionnalité de lignage dans Tableau Catalog indexe à la fois le contenu interne et le contenu externe. Pour plus d’informations, voir Utiliser le lignage pour l’analyse d’impact.
Grâce au lignage, vous pouvez déterminer le propriétaire du contenu à l'extrémité du graphique. La liste des propriétaires inclut tout utilisateur marqué comme propriétaire d'un classeur, d'une source de données ou d'un flux, et tout utilisateur marqué comme point de contact pour une base de données ou une table dans le lignage. Si une modification doit être appliquée, vous pouvez envoyer un e-mail aux propriétaires concernés pour les informer de l'impact de cette modification. Pour en savoir plus, consultez la rubrique Utiliser l'e-mail pour contacter les propriétaires.
Considérations clés en matière de gestion des métadonnées
- Quel est le processus de curation des sources de données ?
- La source de données a-t-elle été dimensionnée en fonction de l'analyse souhaitée ?
- Quelles sont les normes en vigueur dans l'entreprise pour les conventions d'attribution de noms et la mise en forme des champs ?
- Le modèle de données Tableau répond-il à tous les critères pour la curation, notamment l'utilisation de conventions conviviales d'attribution de noms ?
- La liste de contrôle des métadonnées a-t-elle été mise en place, publiée et intégrée dans les processus de validation, de promotion et de certification ?
Surveillance et gestion
La surveillance occupe une place critique dans un modèle en libre-service, car elle permet à l'IT et aux administrateurs de comprendre la manière dont les données sont utilisées, et de répondre de manière proactive et efficace aux évènements liés à l'utilisation, aux performances, à la connexion aux données et aux erreurs d'actualisation. En fonction des normes en place dans votre entreprise pour vos bases de données, l'IT peut utiliser un ensemble d'outils et de programmations pour ingérer et surveiller les données brutes et étudier l'état du serveur.
Tout comme les utilisateurs métier qui exploitent les données pour améliorer la prise de décisions, les administrateurs ont également la possibilité de prendre des décisions basées sur les données à propos de leur déploiement Tableau. Grâce aux vues administratives par défaut et personnalisées de Tableau Server, les administrateurs de site et Tableau Server peuvent surveiller l'état des actualisations d'extraits, l'utilisation des sources de données et l'envoi des abonnements et des alertes. Les vues administratives personnalisées peuvent être créées à partir des données du référentiel Tableau Server. Dans Tableau Cloud, les administrateurs de site peuvent surveiller l'activité des sites avec des vues administratives par défaut et utiliser la Console Administrateur pour créer des vues personnalisées. Pour en savoir plus, consultez les rubriques Surveillance Tableau et Mesure de l'engagement et de l'adoption des utilisateurs Tableau.
Considérations clés en matière de surveillance et de gestion
- Avez-vous défini des plages horaires pour l'exécution des actualisations d'extraits ?
- Comment surveillez-vous l'ingestion de données brutes depuis les systèmes sources ? Les tâches se sont-elles correctement exécutées ?
- Certaines sources de données apparaissent-elles en double ?
- Quand les actualisations d'extraits sont-elles programmées pour s'exécuter ? Pendant combien de temps les extraits sont-ils exécutés sur le serveur ? L'actualisation a-t-elle réussi ou échoué ?
- Des programmations d'abonnements sont-elles prévues une fois l'actualisation d’extrait effectuée ?
- Des sources de données sont-elles utilisées ? Par qui ? Où se situe l'utilisation des sources de données par rapport à la taille du public attendue ?
- Quel processus avez-vous mis en place pour supprimer les sources de données publiées obsolètes ?
Synthèse sur la gouvernance des données
Il est indispensable de trouver le juste milieu entre contrôle et flexibilité. En dépit de l'existence de politiques de gouvernance strictes, les utilisateurs choisissent souvent d'enregistrer des données sensibles et du contenu analytique en local pour les analyser rapidement. Dans un environnement en libre-service, le rôle de la gouvernance des données est d'autoriser l'accès aux données et permettre aux utilisateurs de trouver les réponses qu'ils cherchent, tout en appliquant des règles de sécurité. Même si chaque entreprise aura des besoins différents, le tableau ci-dessous décrit un environnement idéal pour la gouvernance d'accès aux données en libre-service :
Secteur | Administrateurs IT/ | Auteurs de contenu |
---|---|---|
Gestion des sources de données | Fournir un accès aux sources de données et se conformer à la stratégie de données, aux politiques et aux procédures de l'entreprise. | Définir, gérer et mettre à jour les modèles de données utilisés pour les analyses. |
Qualité des données | Définir le processus pour valider les données et renforcer la fiabilité de leur précision pour faciliter la prise de décisions. | Capturer et présenter les règles de nettoyage des données appliquées pour les modèles de données publiés. |
Enrichissement et préparation | Créer des processus ETL à partir de plusieurs sources de données pour préparer celles-ci pour les analyses. | Capturer et présenter les règles d'enrichissement et de préparation des données appliquées pour les modèles de données publiés. |
Sécurité des données | Définir les paramètres de sécurité et les contrôles d'accès liés aux modèles de données publiés. | Se conformer aux politiques de sécurité des données de l'entreprise et aux réglementations externes. |
Gestion des métadonnées | Définir des processus et politiques internes pour la gestion des métadonnées. | Définir, mettre à jour et présenter les métadonnées au niveau des champs pour les utilisateurs. |
Surveillance et gestion | Contrôler et auditer l'utilisation pour assurer le respect et l'utilisation appropriée des données. | Contrôler et suivre les métriques d'utilisation des modèles de données gérés de manière centralisée. |
Gouvernance du contenu avec Tableau
Avec l'utilisation de l'analytique qui se renforce, les entreprises prendront de plus en plus de décisions métier cruciales en se basant sur les données. Résultat : une augmentation du volume du contenu, mais aussi une plus grande diversité des niveaux de compétence des utilisateurs qui collaboreront et découvriront des informations exploitables. Avec toujours plus de personnes utilisant les données au quotidien, il est essentiel que le contenu de Tableau soit sécurisé, géré et approuvé, mais aussi correctement organisé, pour permettre aux utilisateurs de découvrir, utiliser et créer du contenu en toute confiance. Sans gouvernance du contenu, les utilisateurs ont de plus en plus de mal à trouver des éléments pertinents au milieu de classeurs et sources de données peu fiables, obsolètes ou en double.
La gouvernance du contenu inclut les processus permettant de maintenir le contenu pertinent et à jour, comme la capacité à déterminer quand désaffecter du contenu car il ne génère pas le trafic attendu, ou à définir les raisons pour lesquelles un tableau de bord important n'est pas utilisé pour la prise de décisions. C'est aux auteurs de contenu qu'il incombe de vérifier la conformité du contenu avec les politiques internes. Il s'agit là d'une responsabilité cruciale.
Cette section présente aux administrateurs IT et utilisateurs métier les concepts centraux sur lesquels s'appuient les fonctionnalités de gouvernance de contenu de Tableau, et leur donne des conseils pour mettre en application ces concepts afin de gérer le contenu créé dans le cadre d'une plate-forme analytique moderne efficace.
Gestion de contenu
La mise en place d'une structure d'organisation du contenu cohérente permet aux administrateurs de gérer le contenu et de le rendre plus facile à découvrir par les utilisateurs. Tableau Server et Tableau Cloud vous donnent la flexibilité nécessaire pour structurer votre environnement et gérer votre contenu en fonction des besoins de votre entreprise en matière de gouvernance. Lorsque votre site dispose d'une structure précise, il est plus simple de proposer de véritables fonctionnalités analytiques évolutives en libre-service et de garantir une utilisation responsable des données. Les utilisateurs peuvent ainsi effectuer des découvertes et les partager.
Projets
Pour échanger et collaborer, les utilisateurs créent et publient du contenu dans un projet sur Tableau Server ou Tableau Cloud. Les projets sont des conteneurs par défaut permettant d'organiser et de sécuriser du contenu. Ils rassemblent des classeurs, sources de données, flux et autres projets imbriqués. Ce système évolutif vous permet de gérer l'accès au contenu publié sur Tableau.
La gouvernance de votre contenu doit prendre exemple sur le dynamisme de l'entreprise. Les projets et projets imbriqués fonctionnent comme les dossiers d'un système de fichiers. Leurs structures hiérarchiques, basées sur des autorisations, permettent aux utilisateurs et groupes d'accéder à des données et des contenus pertinents selon leur rôle dans l'entreprise. Seuls les administrateurs peuvent créer des projets de niveau supérieur. Toutefois, les projets imbriqués peuvent être facilement confiés aux responsables et propriétaires de projets en fonction de leurs besoins particuliers. Le contenu est généralement géré selon une approche organisationnelle (par service ou équipe), fonctionnelle (par sujet) ou hybride. Lors de la planification de la structure du contenu, l'équipe transversale Tableau doit établir des conventions d'attribution de noms cohérentes pour les projets et déterminer les groupes qui pourront y accéder.
Prenons l'exemple d'un déploiement initial de Tableau Server où les services commercial, marketing et IT sont intégrés. Des projets de niveau supérieur sont alors créés pour chaque service, en fonction de la structure organisationnelle. Les utilisateurs de ces trois services font également partie de l'équipe transversale chargée de la transformation digitale. Le contenu de cette équipe doit être fourni aux utilisateurs de plusieurs services. Ainsi, un projet distinct « Transformation digitale » doit également être créé. Les utilisateurs de chaque service font partie d'un groupe autorisé à accéder à ce contenu. Ne vous souciez pas du nombre de projets que vous voyez en tant qu'administrateur : les utilisateurs et groupes peuvent uniquement consulter les projets auxquels ils ont accès.
Projets sandbox et certifiés
Pour faciliter le libre-service, utilisez des projets sandbox et de production. Les projets sandbox comportent du contenu ad hoc ou non certifié, tandis que les projets de production contiennent du contenu validé et certifié. Les utilisateurs doivent bien comprendre que ces deux types de projets n'ont pas la même finalité. Tous les auteurs de contenu ayant accès à un projet sandbox peuvent explorer librement des données, créer du contenu et effectuer des analyses ad hoc. Puisque les projets de production rassemblent du contenu validé et certifié, ils sont plus fiables et peuvent encourager la prise de décisions basées sur les données.
Seul un faible nombre d'utilisateurs peut valider, promouvoir et certifier du contenu au sein d'un projet de production. Ces tâches de gestion de contenu doivent être déléguées aux responsables et propriétaires de projet. Pour en savoir plus, consultez la section Administration au niveau des projets (Tableau Server | Tableau Cloud). Les processus de validation, promotion et certification du contenu, ainsi que les rôles associés, sont décrits plus loin sur cette page.
Le schéma ci-dessous présente la hiérarchie de projets du service commercial, avec un projet Sources de données, qui contient les sources de données de l'ensemble du service. Les projets imbriqués correspondent aux différentes régions. Les groupes associés aux utilisateurs de chaque région peuvent accéder au projet imbriqué de leur propre région. Le contenu créé par les régions s'ajoute aux projets imbriqués. Ces derniers servent à organiser et à sécuriser le contenu en fonction des besoins. Pour schématiser votre structure de contenu Tableau, il est conseillé de partir de votre hiérarchie organisationnelle. En effet, les services gèrent probablement déjà la sécurité, les données et l'accès aux applications selon les fonctions de chacun.
Ici, le service Marketing est organisé de façon à proposer des ressources communes, telles que les sources de données et le contenu de production partagés à l'ensemble du service. Toutefois, l'accès à certaines ressources est limité à un groupe spécifique. Ainsi, le groupe Digital possède ses propres projets sandbox et de production. Voici la hiérarchie de projets du service Marketing :
Les autorisations doivent être gérées au niveau des projets, à l'aide de projets et de groupes verrouillés, afin d'appliquer un accès gouverné au contenu et de simplifier l'administration. Bien qu'il soit possible de gérer les autorisations au niveau des éléments, avec des projets non verrouillés, une telle approche devient rapidement complexe. Les projets verrouillés garantissent la sécurité des données, tout en favorisant la collaboration entre les projets si nécessaire. Pour en savoir plus, consultez la rubrique Utiliser des projets pour gérer l'accès au contenu (Windows | Linux).
Avec le lancement de Tableau 2020.1 et des projets imbriqués verrouillés, les projets peuvent être verrouillés à n'importe quel niveau de la hiérarchie, même si le projet parent est verrouillé avec d'autres autorisations. Pour gérer plus efficacement le contenu et les autorisations, les administrateurs de site et de serveur Tableau Server et les administrateurs de site Tableau Cloud peuvent déléguer les responsabilités de gestion de contenu aux propriétaires ou aux responsables de projet, qui comprennent mieux la portée des projets. Ces derniers peuvent alors utiliser les projets imbriqués verrouillés, en appliquant à n'importe quel niveau de la hiérarchie un modèle d'autorisations qui répond aux besoins de leur groupe.
Cochez la case Appliquer aux projets imbriqués pour verrouiller de façon indépendante les projets imbriqués.
Collections
Les Collections, introduites dans la version 2021.2, servent de conteneur virtuel pour vos contenus. Les collections sont similaires à une playlist sur un service de streaming : elles vous permettent de sélectionner une combinaison de contenus à partager avec d'autres utilisateurs. Cette fonctionnalité diffère des favoris, dans la mesure où ces derniers ne peuvent être partagés.
Tout utilisateur Tableau doté d’un rôle sur le site peut utiliser des collections.
Vous pouvez ajouter la plupart des types de contenus (classeurs, vues, métriques, sources de données, etc.) à une collection où que vous soyez sur un site, quel que soit l'emplacement du projet. Il s'agit d'une manière flexible d'intégrer de nouveaux coéquipiers, d'appuyer vos workflows et de partager du contenu sans devoir déplacer ou dupliquer les ressources existantes. Les autorisations restent valides et seuls les utilisateurs autorisés pourront accéder au contenu disponible dans une collection.
Vous pouvez utiliser les collections de diverses manières dans le cadre de l'infrastructure de gestion de contenu en place dans votre organisation. Si l'on reprend l'exemple précédent, on peut imaginer que votre organisation dispose de plusieurs projets (Ventes et Marketing). Vous pouvez créer une collection pour permettre à vos utilisateur de retrouver facilement le contenu adéquat dans ces projets. Désormais, les équipes peuvent facilement ajouter du contenu autour d'un thème spécifique, le tout de manière centralisée.
Sandbox personnelle
Pour proposer un emplacement permettant à tous les utilisateurs d'enregistrer leur travail dans Tableau Server ou Tableau Cloud, vous pouvez créer une sandbox personnelle et appliquer des autorisations pour faire en sorte que les propriétaires de contenu puissent uniquement consulter leur propre contenu. La sandbox personnelle peut servir à effectuer des analyses ad hoc ou d'avancement et à masquer le contenu qui n'est pas encore prêt à être partagé. Lorsqu'ils le souhaitent, les utilisateurs peuvent déplacer leur contenu vers la sandbox du service, afin de commencer les processus de validation, de promotion et de certification. L'utilisation d'une sandbox personnelle propre à chaque utilisateur permet de réduire le nombre de projets à sécuriser et à gérer, ce qui diminue le volume de tâches administratives. Après avoir créé un projet de niveau supérieur intitulé « Sandbox personnelle », définissez l'autorisation Tous les utilisateurs sur Publier pour les projets, et Aucun pour les classeurs, les sources de données, les flux et les métriques (L’ancienne fonctionnalité Métriques a été supprimée de Tableau Cloud en février 2024 et de Tableau Server version 2024.2. Pour plus d’informations, consultez Créer et dépanner des métriques (supprimé).).
Autorisations de publication uniquement, seulement au niveau des projets
Étant donné que le contenu de la sandbox personnelle est regroupé en un seul emplacement, les administrateurs peuvent surveiller la fréquence de consultation du contenu, suggérer aux propriétaires lorsqu'ils doivent supprimer du contenu obsolète et vérifier qui utilise le plus sa sandbox personnelle. Les propriétaires de contenu peuvent toujours accéder à leur propre contenu, même si celui-ci a été publié dans un projet pour lequel ils ne peuvent pas consulter de classeurs ni de sources de données. Les autorisations sont expliquées plus en détail dans la section suivante.
Sites
Tableau Server et Tableau Cloud adoptent une approche multilocataire basée sur les sites. Dans Tableau Server, vous pouvez créer plusieurs sites afin de mettre en place des limites de sécurité qui isolent des utilisateurs, groupes, données et contenus spécifiques au sein d'un même déploiement Tableau Server. Les utilisateurs d'un site n'ont pas forcément accès à un autre site et ne savent même pas qu'il existe. Grâce à ces limites strictes, les sites permettent d'empêcher efficacement la collaboration entre utilisateurs lorsque cela s'avère nécessaire, ou de séparer les contenus durant toutes les phases de développement.
Le schéma ci-dessous présente deux exemples de sites Tableau Server. Ici, les utilisateurs uniques du site 1 n'ont pas accès au site 2, ni même à ses données et contenus. Un utilisateur qui peut accéder aux sites 1 et 2 peut uniquement se connecter à un site à la fois. Si les utilisateurs des deux sites ont besoin d'accéder à du contenu commun, celui-ci doit être dupliqué au sein de chaque site, ou un nouveau site doit être créé afin de rassembler le contenu partagé de ces utilisateurs. Cela augmente fortement les besoins administratifs en matière de surveillance, de mesure et de maintenance. Dans Tableau Cloud, votre instance de Tableau constitue un seul site.
Les sites créent des limites absolues (voir le schéma ci-dessus).
Les sites Tableau Server peuvent sembler au premier abord constituer l'outil idéal pour répartir des sources de données, des classeurs et des utilisateurs. Toutefois, à cause des limites de sécurité, la collaboration et la promotion des contenus sont restreintes, ce qui empêche les entreprises de déployer une véritable solution en libre-service évolutive. Pour cette raison, réfléchissez bien avant d'utiliser des sites à la place des projets dans un déploiement avec un seul site et une délégation des responsabilités de gestion de contenu car les implications sont différentes. Les limites absolues entre plusieurs sites sont contraignantes : lorsque vous configurez un nouveau site, vous devez recréer toutes les sources de données pertinentes dans cette nouvelle instance.
Créez uniquement un nouveau site lorsque vous devez gérer de façon isolée un ensemble unique d'utilisateurs et de contenus Tableau, afin de ne pas partager ces contenus en dehors du site. Pour consulter des informations supplémentaires ainsi que des scénarios d'utilisation pertinente des sites, consultez la rubrique Présentation des sites (Windows | Linux).
Considérations clés en matière de gestion de contenu
- Les classeurs et les sources de données seront-ils partagés dans l'ensemble de l'entreprise ?
- Les sites seront-ils utilisés pour isoler le contenu ou les services sensibles ?
- Les projets utiliseront-ils une approche organisationnelle (services/équipes), fonctionnelle (rubriques) ou hybride ?
- Des projets de sandbox et de production ont-ils été mis en place pour prendre en charge le contenu ad hoc et le contenu validé ?
- Utilisez-vous des conventions d'attribution de noms pour le contenu ?
- Les auteurs publient-ils plusieurs exemplaires du même classeur, avec différents filtres sélectionnés ?
- Le contenu comporte-t-il une description et des balises, et est-il conforme aux styles visuels ?
- Avez-vous défini des attentes en matière de durée de chargement, et avez-vous mis en place une procédure pour les exceptions ?
- Lorsque des employés quittent l'entreprise, quel processus appliquez-vous pour réattribuer la propriété sur le contenu ?
Autorisation
Lorsqu'un utilisateur tente de se connecter à Tableau, son identité est vérifiée par un système d'authentification. Un utilisateur doit exister dans le magasin d'identités de Tableau Server (Windows | Linux) pour chaque personne devant accéder à Tableau Server. L'authentification Tableau Cloud prend en charge Tableau, Google et SAML pour vérifier l'identité d'un utilisateur. Une fois l'authentification effectuée, l'autorisation permet de déterminer le contenu auquel l'utilisateur a accès sur Tableau Server et Tableau Cloud, et comment il peut y accéder. L'autorisation inclut :
- Ce que les utilisateurs sont autorisés à faire avec le contenu hébergé sur Tableau Server et Tableau Cloud, y compris le site, les projets, les classeurs, les vues, les sources de données et les flux.
- Les tâches que les utilisateurs sont autorisés à effectuer pour gérer Tableau Server et Tableau Cloud, notamment la configuration des paramètres du serveur et du site, l'exécution d'outils en ligne de commande, la création de sites, et bien d'autres.
Ce sont Tableau Server et Tableau Cloud qui gèrent l'autorisation applicable à ces actions. Cette autorisation est déterminée en fonction du type de licence de l'utilisateur, du rôle de l'utilisateur sur le site et des autorisations associées aux éléments comme les classeurs et les sources de données. Les licences Tableau basées sur les utilisateurs comportent un aspect implicite de gouvernance, en raison des fonctionnalités qu'elles intègrent. Pour en savoir plus sur les fonctionnalités spécifiques de chaque licence, consultez la page Tableau pour les équipes et les entreprises.
Lorsque vous ajoutez des utilisateurs à un site sur Tableau Server ou Tableau Cloud, vous devez leur attribuer un rôle sur le site, quel que soit le type de leur licence. Ce rôle désigne le niveau d'accès maximal dont un utilisateur bénéficie sur votre site.
Les utilisateurs détenant une licence Tableau Creator ont accès à Tableau Server ou Tableau Cloud, Tableau Desktop, Tableau Prep Builder et Tableau Mobile. Les rôles suivants utilisent une licence Tableau Creator :
Rôle sur le site | Description |
---|---|
Administrateur de serveur | Disponible sur Tableau Server uniquement. Ne s’applique pas à Tableau Cloud. Configure les paramètres pour Tableau Server, tous les sites sur le serveur, les utilisateurs, les groupes et les éléments de contenu, comme les projets, les sources de données (y compris les informations de connexion), les classeurs et les flux. Se connecte aux sources de données publiées Tableau ou à des données externes, depuis le navigateur, Tableau Desktop ou Tableau Prep Builder ; crée et publie des sources de données et des flux ; crée et publie des classeurs. |
Administrateur de site - Creator | Accès illimité au contenu comme décrit ci-dessus, mais au niveau du site. Se connecte à des données Tableau ou externes, depuis le navigateur, Tableau Desktop ou Tableau Prep Builder ; crée des sources de données ; crée et publie du contenu. Dans Tableau Server, les administrateurs de serveur peuvent accorder aux administrateurs de site la possibilité, ou non, de gérer les utilisateurs et d'attribuer des rôles et des appartenances aux sites. Par défaut, dans Tableau Server, et toujours dans Tableau Cloud, les administrateurs de site bénéficient de ces fonctionnalités. Niveau d’accès le plus élevé pour Tableau Cloud. Les administrateurs de site ont accès aux réglages de configuration des sites. |
Tableau Creator | Se connecte aux données pour créer des sources de données et des tableaux de bord, qui sont publiés et partagés sur Tableau Server et Tableau Cloud. Les gestionnaires de données (administrateurs de base de données ou analystes) publient les sources de données. Les utilisateurs Creator intègrent les définitions des processus, les politiques, les directives et les connaissances en matière de gestion des métadonnées, dans le respect des obligations structurelles et/ou réglementaires de l'entreprise.
|
Les utilisateurs avec une licence Tableau Explorer ont accès à Tableau Server ou Tableau Cloud, et Tableau Mobile. Les rôles suivants utilisent une licence Tableau Explorer :
Rôle sur le site | Description |
---|---|
Administrateur de site - Explorer | Même accès au site et à la configuration d'utilisateurs que l'administrateur de site - Creator, mais ne peut pas se connecter à des données externes depuis l'environnement de modification sur le Web. Se connecte aux sources de données publiées Tableau pour créer des classeurs, ainsi que pour modifier et enregistrer les classeurs existants. |
Explorer (peut publier) | Publie du nouveau contenu depuis un navigateur, consulte les vues publiées et interagit avec, utilise toutes les fonctionnalités d'interaction. Dans l'environnement de modification sur le Web, peut modifier et enregistrer des classeurs existants, et enregistrer de nouvelles sources de données autonomes depuis les connexions de données intégrées dans les classeurs, mais ne peut pas se connecter à des données externes ni créer de nouvelles sources de données. |
Explorer | Consulte les vues publiées et interagit avec. Peut s'abonner à du contenu, créer des alertes basées sur les données, se connecter aux sources de données publiées Tableau et ouvrir des classeurs dans l'environnement de création Web pour des requêtes ad hoc, mais ne peut pas enregistrer son travail.
|
Les utilisateurs avec une licence Tableau Viewer ont accès à Tableau Server ou Tableau Cloud, et Tableau Mobile.
Rôle sur le site | Description |
---|---|
Viewer | Affiche les filtres et le contenu et interagit avec. Peut également recevoir des alertes déclenchées par des évènements. |
Les utilisateurs ajoutés à Tableau Server ou Tableau Cloud, mais ne disposant pas de licence sont indiqués comme Sans licence.
Rôle sur le site | Description |
---|---|
Sans licence | Les utilisateurs sans licence ne peuvent pas se connecter à Tableau Server ni Tableau Cloud.
|
Le rôle sur le site et les autorisations sur le contenu déterminent quels utilisateurs peuvent interagir avec du contenu et en publier, ceux qui peuvent le uniquement consulter, ou encore ceux qui peuvent gérer les utilisateurs et administrer le site. L'équipe du projet doit réfléchir au modèle d'autorisations de contenu et le définir. Les administrateurs Tableau Server et/ou de site attribuent les règles d'autorisation aux groupes et les verrouillent dans le projet. Les projets verrouillés appliquent des règles d'autorisation sur tout le contenu du conteneur, y compris les projets imbriqués. Pour en savoir plus, consultez la rubrique Définir les autorisations par défaut pour le projet et verrouiller le projet.
Tableau dispose de règles d'autorisation par défaut pour les projets, les classeurs et les sources de données. Vous pouvez également définir des règles d'autorisation personnalisées pour ces types de contenus.
Modèle de règles d'autorisation | Description |
---|---|
Responsable de projet | Associé au rôle sur le site approprié, accorde à l'utilisateur ou au groupe le plein accès au projet, à ses projets enfants et au contenu publié dans cette hiérarchie de projet.
|
Éditeur | Autorise l'utilisateur ou le groupe à se connecter, modifier, télécharger, supprimer et définir des autorisations pour les sources de données ou classeurs de ce projet.
Il peut également publier des sources de données et, s'il en est propriétaire, mettre à jour les informations de connexion et les programmations d'actualisation d’extrait. Cette autorisation est pertinente pour des vues lorsque la vue à laquelle ils accèdent se connecte à une source de données.
|
Publicateur | Autorise l'utilisateur ou le groupe à publier des classeurs et des sources de données sur le projet.
|
Connecteur | Autorise l'utilisateur ou le groupe à se connecter aux sources de données dans le projet.
|
Viewer | Autorise l'utilisateur ou le groupe à afficher les classeurs et les vues dans le projet.
|
Aucun | Définit toutes les fonctionnalités de la règle d'autorisation sur Non spécifié.
|
Refusé | Définit toutes les fonctionnalités de la règle d'autorisation sur Refusé. |
Les autorisations personnalisées offrent une granularité plus fine, de l'accès à une source de données ou son téléchargement au mode d'interaction d'un utilisateur avec le contenu publié. Grâce à l'interface intuitive de Tableau, vous pouvez facilement relier les utilisateurs aux groupes fonctionnels, attribuer les autorisations aux groupes et voir qui a accès à quel contenu. Pour en savoir plus, consultez la rubrique Définir des autorisations sur plusieurs ressources de contenu. Si Data Management est présent, les autorisations pour les ressources externes sont soumises à des considérations supplémentaires. Pour plus d’informations, consultez Gérer les autorisations pour les ressources externes.
Vous pouvez créer des groupes localement sur le serveur ou les importer à partir d'Active Directory/LDP et programmer leur synchronisation régulière (Windows | Linux). Les programmations de synchronisation sont configurées par l'administrateur de Tableau Server ou les administrateurs de site de Tableau Cloud. Pour simplifier la maintenance, attribuez des autorisations aux groupes au niveau du projet, comme indiqué ci-dessous. Pour Tableau Cloud, vous pouvez Automatiser le provisionnement des utilisateurs et la synchronisation des groupes via un fournisseur d'identité externe via SCIM et ajouter/retirer des utilisateurs ou ajouter/retirer des membres dans des groupes de manière programmée, à l'aide de l'API REST.
Pour en savoir plus, consultez les pages Démarrage rapide : Autorisations, Configurer des projets, des groupes et des autorisations pour le libre-service géré et Référence d'autorisations.
Considérations clés en matière d'autorisation
- Quel est le rôle sur le site minimal pour la synchronisation de groupe Active Directory/LDAP ou SCIM ?
- Avez-vous défini toutes les autorisations du groupe Tous les utilisateurs dans le projet Par défaut sur Aucun ?
- Des restrictions explicites (refus d'autorisations) nécessaires sur le groupe Tous les utilisateurs doivent-elles être propagées à chaque compte utilisateur ?
- Avez-vous créé des groupes qui correspondent à un ensemble de fonctionnalités de création et de consultation pour chaque projet ?
- Avez-vous passé en revue les autorisations efficaces sur certains utilisateurs pour tester votre modèle d'autorisations ?
- Avez-vous verrouillé les autorisations dans le projet parent pour garantir la sécurité dans l'ensemble de la hiérarchie de projets ?
- Avez-vous mis en place des noms d'utilisateurs/mots de passe de service pour les sources de données publiées ?
Validation du contenu
La validation de contenu est la première étape d'une série d'évènements qui aboutissent à la certification du contenu. De manière similaire au volet qualité de la gouvernance des données, la validation de contenu regroupe les processus permettant de valider du contenu précis, exhaustif, approuvé, pertinent et récent.
Le premier rôle habilité à valider du contenu doit être son auteur. Les auteurs doivent également recueillir les commentaires du public cible. Pour ce faire, vous pouvez organiser des groupes informels ou partager un lien vers le classeur à évaluer. Les gestionnaires de données interviennent également pour vérifier la pertinence d'une source de données intégrée et son aptitude à être publiée et certifiée. Si la source de données est intégrée dans le classeur, le gestionnaire de données doit déterminer si le classeur est apte à être publié et certifié. Outre la vérification de la justesse des données et des calculs, la validation de contenu doit également inclure un passage en revue du branding, de la mise en page, de la mise en forme, des performances, des filtres, des actions de tableau de bord, ainsi que des cas particuliers en matière de comportement, lesquels seront effectués par l'administrateur de site ou le responsable du projet.
Considérations clés en matière de validation de contenu
- Qui est impliqué dans le processus de validation ?
- Le classeur est-il précis, exhaustif, approuvé, pertinent et récent ?
- Le nouveau contenu remplace-t-il le contenu existant ?
- Les données et les calculs sous-jacents sont-ils corrects ?
- Le classeur reflète-t-il le branding de l'entreprise ?
- La disposition du classeur est-elle logique ?
- Les axes et les chiffres ont-ils le bon format ?
- Les tableaux de bord se chargent-ils dans un délai acceptable ?
- Les filtres et les actions de tableau de bord se comportent-ils de la manière attendue sur les vues cibles ?
- Le tableau de bord garde-t-il son utilité dans les cas particuliers (filtrage sur toutes les valeurs, aucune valeur, une seule valeur, etc.) ?
Promotion du contenu
Une fois la validation de contenu effectuée, le processus de promotion permet de publier le classeur vers un emplacement approuvé, ou d'ajouter un badge de certification pour les sources de données publiées. Voici un exemple de workflow pour classeur.
Workflow pour classeur
Les auteurs du contenu se connectent aux données, créent des tableaux de bord, puis publient leurs créations vers le projet Sandbox. Les administrateurs de site ou responsables du projet valident et approuvent le contenu. Le contenu approuvé est publié dans le projet de production. L'outil Content Migration Tool, disponible dans le cadre de Tableau Advanced Management, facilite la promotion ou la migration de contenu entre projets Tableau Server. Les projets peuvent se trouver sur des installations Tableau Server distinctes (entre une instance de développement et une installation produit avec gestion des licences appropriée pour chaque environnement, par exemple), ou sur une même installation Tableau Server. L'interface utilisateur de Content Migration Tool vous guide au fil des étapes nécessaires pour établir un plan de migration, que vous pouvez utiliser de manière ponctuelle, ou en tant que modèle pour plusieurs migrations. Pour découvrir d'autres cas d'utilisation, consultez la rubrique Cas d'utilisation de Tableau Content Migration Tool.
Si les exigences IT imposent trois environnements séparés (développement, assurance qualité et production), essayez de ne pas reproduire un cycle de développement en cascade avec une plate-forme analytique moderne. Les utilisateurs peuvent préférer un environnement d'assurance qualité (pour contourner des politiques strictes ou éviter les retards de mise en production du contenu), et vous devez trouver un bon équilibre en automatisant la migration de contenu vers le serveur de production grâce à des scripts personnalisés utilisant les API REST Tableau.
Considérations clés en matière de promotion de contenu
- Qui est impliqué dans le processus de promotion ?
- Les rôles habilités à la promotion de contenu disposent-ils d'une liste de critères à évaluer ?
- Avez-vous établi une distinction claire entre contenu certifié et contenu ad hoc pour vos projets ?
- Le processus est-il suffisamment agile pour prendre en charge les itérations et les innovations ?
- Avez-vous mis en place des workflows pour gérer les sources directes et les sources restreintes pour les données et les classeurs ?
Certification du contenu
Une fois le contenu validé et promu, il obtient un statut certifié prouvant sa fiabilité lorsqu'un administrateur de site, responsable de projet ou publicateur (auteur de contenu ou gestionnaire de données) disposant des autorisations nécessaires sur le projet de production promeut le classeur ou la source de données à l'emplacement désigné. La certification donne davantage de visibilité au contenu, et améliore les capacités du gestionnaire de données à gérer efficacement les données à l'échelle de l'entreprise dans Tableau, en réduisant la prolifération de classeurs ou sources de données en double.
Utilisez les besoins de base définis dans le cadre des considérations clés en matière de validation de contenu comme critères pour obtenir la certification. Les auteurs de contenu doivent avoir une bonne compréhension du fonctionnement de bout en bout du processus de certification, et les utilisateurs de contenu doivent savoir où le contenu certifié est publié dans le projet de production, comme défini dans vos normes de gestion de contenu.
La certification des sources de données permet aux gestionnaires de données de promouvoir des sources spécifiques dans votre déploiement Tableau, pour les approuver et les rendre prêtes à l'utilisation. Les sources de données certifiées bénéficient d'un traitement préférentiel dans les résultats de recherche de Tableau Server et Tableau Cloud et dans notre algorithme intelligent de recommandations de sources de données. Elles sont faciles à trouver et réutilisables.
Source de données certifiée
Considérations clés en matière de certification de contenu
- Qui est en charge de la désignation du contenu certifié ?
- Tous les critères nécessaires pour obtenir le statut de certification sont-ils respectés ?
- Tous les champs (à propos, remarques sur la certification, balises) sont-ils renseignés ?
Utilisation du contenu
L'utilisation de contenu permet de mesurer l'utilisation réelle des données dans le cadre des décisions métier, mais l'analyse du trafic vers les vues ne permet pas à elle seule d'obtenir une vue complète. La mesure de l'utilisation de contenu permet d'optimiser la taille de votre déploiement et de la faire évoluer en fonction des comportements des utilisateurs (qui crée/qui utilise du contenu ?), et de la pertinence des tableaux de bord et des sources de données. Si un contenu n'est pas utilisé, vous serez en mesure de le déterminer et de prendre les mesures qui s'imposent.
Les administrateurs Tableau Server et les administrateurs de site Tableau Cloud doivent surveiller les tendances d'utilisation générales grâce aux vues administratives par défaut. Pour répondre à des besoins plus spécifiques, il est possible de créer des vues administratives personnalisées. Pour Tableau Server, les vues administratives personnalisées peuvent se baser sur les données du référentiel Tableau Server. Dans Tableau Cloud, les administrateurs de site peuvent surveiller l'activité des sites avec des vues administratives par défaut et utiliser la Console Administrateur pour créer des vues personnalisées. Les administrateurs de site doivent mesurer et auditer l'utilisation du contenu publié (certifié et ad hoc) sur leur site. Par exemple, si l'utilisation du contenu ad hoc est considérablement supérieure à celle du contenu certifié, peut-être que le processus de promotion est trop restrictif ou prend trop de temps pour les besoins métier.
Les administrateurs de site doivent passer en revue l'utilisation du contenu, en fonction de la taille du public attendue indiquée dans l'onglet Cas d'utilisation et sources de données Tableau du Planificateur Tableau Blueprint. Les auteurs individuels peuvent également étudier l'utilisation de leur contenu dans une infobulle en survolant la miniature d'un classeur ou avec l'option Qui a consulté cette vue ? dans le menu. Pour en savoir plus, consultez la rubrique Mesure de l'engagement et de l'adoption des utilisateurs Tableau.
Considérations clés en matière d'utilisation de contenu
- Quel est le volume de trafic de chaque vue ?
- Qu'est-ce qu'un contenu obsolète ? À quelle fréquence le contenu obsolète est-il éliminé ?
- Quelle est la part d'utilisation indirecte (alertes et abonnements) ?
- Les abonnements sont-ils mis à disposition en temps et en heure ?
- La taille réelle de l’audience correspond-elle aux attentes ?
- Le contenu suit-il une tendance hebdomadaire, mensuelle, trimestrielle ?
- Quelle est la fréquence de connexion ou combien de jours se sont écoulés depuis la dernière connexion par cohorte d'utilisateurs ?
- Quelle est la distribution de la taille des classeurs et des sources de données ?
Synthèse sur la gouvernance du contenu
Le tableau ci-dessous définit l'état idéal pour promouvoir et gérer le contenu dans un déploiement analytique moderne efficace :
Secteur | Administrateurs IT/Professionnels BI | Auteurs de contenu |
---|---|---|
Gestion de contenu | Créer et gérer un environnement destiné au stockage et à l'organisation du contenu publié.
| S'assurer que le contenu de leur site ou projet est pertinent |
Sécurité et autorisations | Sécuriser le contenu analytique et accorder aux utilisateurs les niveaux d'accès appropriés en fonction du type de contenu, de sa sensibilité, des besoins de l'entreprise, etc.
| Se conformer aux politiques internes en matière de sécurité et de gestion des autorisations |
Validation du contenu | Définir un processus pour valider la justesse du contenu. | Accéder aux fonctionnalités de la plate-forme pour faciliter la validation et la vérification de l'exactitude du contenu analytique généré par les utilisateurs.
|
Promotion du contenu | Définir un processus pour promouvoir le contenu. | Promouvoir le contenu analytique validé dans un environnement sécurisé et centralisé, conformément au processus de gouvernance.
|
Certification du contenu | Définir un processus pour certifier le contenu. | Certifier le contenu approuvé et le distinguer du contenu non approuvé dans le même environnement.
|
Utilisation du contenu | Mesurer les tendances d'utilisation générales des différentes unités opérationnelles de l'entreprise. | Mesurer et auditer l'utilisation du contenu publié et suivre l'utilisation du contenu non approuvé.
|