Connexion aux sources de données

L'une des raisons principales pour laquelle les utilisateurs avancés de Tableau ont un faible pour Tableau Server est qu'il rend possible la collaboration. Lorsque votre organisation met en place Tableau Server, il se produit un glissement conceptuel important pour vous-même et vos utilisateurs dans votre manière d'envisager le partage des classeurs et des données que les classeurs vous aident à analyser.

Concevoir les données en termes Tableau Server

Si vous utilisez seulement Tableau Desktop, vous gérez toutes vos propres connexions aux données. Par exemple, vous pouvez ouvrir Tableau, vous connecter à SQL Server, puis sélectionner la base de données, la table et les colonnes avec lesquelles vous allez travailler. Ou vous pouvez vous connecter à un tableur Excel et sélectionner la feuille à analyser. Vous ne pensez généralement pas à la manière dont vous allez partager les données avec d'autres personnes. De fait, une erreur de débutant, que nous avons tous faite, consiste à créer une classeur basé sur un fichier Excel local, d'enregistrer le classeur en tant que fichier .twb, puis d'envoyer le classeur par email à d'autres utilisateurs pour le leur faire admirer. Et bien entendu, ils ne voient rien, parce que le classeur que vous avez envoyé par email ne peut en fait pas sortir de votre fichier Excel local.

Maintenant que vous avez installé Tableau Server, vous-même et vos utilisateurs pouvez apprendre une nouvelle manière de concevoir les classeurs et les données. Les utilisateurs vont, de manière naturelle, partager leurs classeurs en les publiant sur Tableau Server. Mais ils devront également penser à la manière de partager les données qui sont utilisées par ces classeurs.

Lorsque vos utilisateurs ont à disposition Tableau Server, vous pouvez partager les données de plusieurs façons :

  • Créez et publiez des classeurs complets contenant les extraits créés dans Tableau Desktop. D'autres utilisateurs peuvent travailler avec ces classeurs et les données statiques des extraits.

  • Publiez une source de données définissant une connexion vers une base de données et incluant les informations sur les données à utiliser dans cette base de données. Les utilisateurs peuvent alors créer des classeurs qui pointent vers cette source pour leurs données.

Prévoir l'optimisation de l'accès et de la sécurité des données

Vous-même et vos utilisateurs devez donc envisager les manières de partager l'accès aux données, mais également apprendre à utiliser les données de la manière la plus efficace possible. Au premier abord, il peut sembler complexe d'optimiser l'accès aux données avec Tableau Server. Tableau prend en charge de nombreux connecteurs de données. Chaque connecteur est optimisé pour les données auxquelles il se connecte, et chacun présente des caractéristiques différentes. Nombre d'entre eux ont des exigences différentes en matière d'authentification. Certains n'autorisent pas les extraits. Certains prennent en charge un filtrage des requêtes et des opérations complexes, alors que d'autres sont plus limités.

À mesure que vous vous familiarisez avec Tableau Server et apprenez à optimiser l'accès aux données pour vos scénarios, vos utilisateurs constateront les avantages suivants :

  • Performances. L'objectif est le "flux". Lorsque les utilisateurs sont dans le flux de l'analyse de données, l'exploitation des données de plusieurs manières peut les aider à approfondir leurs analyses. Votre objectif est de configurer un accès aux données qui évite d'interrompre autant que possible l'expérience de flux de vos utilisateurs.

  • Accès aux données. Pour de nombreuses organisations, l'activité exige un accès approprié aux données. En tant qu'administrateur Tableau Server, vous pouvez faire en sorte que l'accès des utilisateurs aux données réponde aux exigences d'authentification et de confidentialité de votre organisation.

  • Source unique pour les données. Vous pouvez utiliser Tableau Server pour améliorer la cohérence des données à l'échelle de votre organisation. Vous pouvez gérer les connexions de sources de données et créer des programmations d'actualisation des extraits répondant aux besoins de vos utilisateurs, et mettre en place une utilisation stable et cohérente des données.

Avant de commencer

Nous avons rédigé ce chapitre à l'attention des utilisateurs avancés de Tableau Desktop à qui l'on a demandé de gérer Tableau Server. Nous partons donc de l'hypothèse que vous comprenez la différence entre une connexion en direct aux données (par exemple SQL Server ou une solution de cloud comme Amazon Redshift) et un extrait. Les termes et concepts suivants doivent vous être familiers :

  • Source de données. Une connexion à une base de données ou autre emplacement de stockage de données, avec des informations sur les données à utiliser dans cette base de données. Les utilisateurs peuvent créer des classeurs qui pointent vers une source de données. Une source de données partagée sur Tableau Server peut contenir un extrait, ou peut contenir des informations de configuration qui décrivent comme accéder à une connexion en direct.

  • Extrait. Un instantané de données. Vous pouvez créer un extrait (fichier .tde ou .hyper) créé depuis une source de données statique, par exemple une feuille de calcul Excel. Ou l'extrait peut contenir des données provenant d'une base de données relationnelle ou de données basées sur le cloud. Vous pouvez programmer l'actualisation des extraits qui sont partagés sur Tableau Server à partir des données sous-jacentes, selon un calendrier que vous définissez.

  • Connexion en direct. Désigne une source de données contenant une connexion en direct à des données sous-jacentes, qui fournit des données en temps réel ou quasiment en temps réel. Dans le cas d'une connexion en direct, Tableau envoie les requêtes directement à la base de données ou autre source, et renvoie les résultats de la requête pour les utiliser dans un classeur. Les utilisateurs peuvent créer des connexions en direct, puis les partager sur Tableau Server. D'autres utilisateurs de Tableau pourront ainsi utiliser les mêmes données avec les mêmes paramètres de connexion et de filtres. En tant qu'administrateur Tableau Server, vous pouvez gérer les informations d'identification et les autorisations associées à la source de données pour contrôler les données auxquelles les utilisateurs peuvent accéder.

  • Exécuter en tant qu'utilisateur. Il s'agit du compte Windows que Tableau Server utilise pour accéder aux données de votre organisation. Nous avons présenté ce compte utilisateur dans les chapitres de planification et d'installation. Le compte Exécuter en tant qu'utilisateur peut faire office de compte Windows que Tableau Server utilise pour obtenir des données. Il est important si vos utilisateurs ont besoin d'accéder à des données provenant de fichiers partagés (par exemple des tableurs Excel partagés), des bases de données Microsoft SQL Server, Oracle ou d'autres sources de données utilisant l'authentification Windows.

Si vous n'êtes pas déjà familier avec ces différents termes d'accès aux données, prenez le temps de consulter Publier des sources de données et des classeurs(Link opens in a new window) dans l'aide de Tableau. Pour rafraîchir vos connaissances sur la manière dont Tableau Server utilise le compte Exécuter en tant qu'utilisateur, consultez la section Planification de votre déploiement précédemment dans ce guide.

Que devez-vous faire ?

Ce chapitre de Tableau Server : Guide d'installation à l'usage de tous présente les trois étapes de base que vous devez effectuer pour endosser votre nouveau rôle d'administrateur de données sur Tableau Server :

  1. Fournir l'accès à des sources de données.

  2. Approfondir votre compréhension des arbitrages entre l'utilisation d'une connexion en direct et d'un extrait.

  3. Tester les différences de performance possibles entre une connexion en direct et un extrait.

Fournir l'accès à des sources de données

Pour fournir l'accès à des sources de données, il faut d'abord comprendre comment diverses sources de données gèrent l'authentification, c'est-à-dire la connexion. Dans la plupart des cas, les bases de données, les données sur le cloud et les cubes demandent aux utilisateurs de s'authentifier avant de pouvoir accéder aux données. Les informations d'authentification sont propres à chaque connecteur, et l'authentification est gérée par chaque connecteur.

En tant qu'administrateur, vous pouvez avoir besoin de coordonner l'accès aux données avec les administrateurs de bases de données ou l'équipe de données au sein de votre organisation. Si vous êtes l'équipe de données, vous devrez comprendre les données que votre organisation utilise ainsi que les exigences d'authentification qu'elle applique. Par exemple, lorsqu'un utilisateur Tableau se connecte à MySQL, l'accès exige obligatoirement l'authentification Windows. Les utilisateurs de Tableau Desktop pour Windows ne sont pas invités à s'authentifier. Mais dans le cas d'un Mac, le connecteur Tableau Desktop pour MySQL invite les utilisateurs Mac à fournir leurs informations d'identification lorsqu'ils tentent de se connecter.

Lorsque cela est possible, nous recommandons une authentification par utilisateur pour l'accès aux données. Dans certains cas toutefois, le compte Exécuter en tant qu'utilisateur peut être utilisé pour accéder à des bases de données ou à des partages de fichiers, par exemple SQL Server. Si l'utilisateur publie un classeur qui utilise une connexion en direct vers SQL Server (et non pas une connexion à un extrait), Tableau Server utilise automatiquement le compte Exécuter en tant qu'utilisateur lorsque d'autres utilisateurs accèdent au classeur. Cela signifie que, lorsqu'un autre utilisateur ouvre le classeur, l'accès de cet utilisateur aux données est défini par le type d'accès que vous-même, en tant qu'administrateur, avez accordé au compte Exécuter en tant qu'utilisateur.

Comme décrit dans le chapitre Planification de votre déploiement, nous vous recommandons de configurer le compte Exécuter en tant qu'utilisateur pour un accès "privilège le plus faible". Dans la plupart du cas, cela signifie un accès en lecture seule aux sources de données auxquelles le compte accède.

Autoriser les utilisateurs à intégrer des informations d'identification (ou pas)

En tant qu'administrateur, vous pouvez décider d'autoriser les utilisateurs à intégrer les mots de passe (qui sont cryptés) dans les classeurs et les sources de données qu'ils publient sur le serveur. Dans ce cas, les autres personnes qui utilisent ces classeurs ou ces sources données peuvent voir les données sans avoir à fournir d'informations d'identification.

Pour activer ou désactiver les données d'identification intégrées, connectez-vous à Tableau Server.

Dans le menu de site, cliquez sur Gérer tous les sites, cliquez sur Paramètres, puis cliquez sur l'onglet Général.

Sélectionnez ou désélectionnez l'option Autoriser les publicateurs à intégrer les informations d'identification dans un classeur ou une source de données.

Il s'agit de paramètres à l'échelle du serveur : tous les paramètres que vous effectuez ici s'appliquent à tous les classeurs de tous les sites.

Notez que, dans certains scénarios, les données d'identification intégrées peuvent fournir par inadvertance un accès à des utilisateurs qui ne devraient pas voir les données. C'est pourquoi, pour les organisations exigeant une authentification de niveau utilisateur aux bases de données, nous conseillons de désactiver les données d'identification intégrées. Les utilisateurs sont alors invités à saisir leurs informations d'identification lorsqu'ils ouvrent un classe, une vue ou un tableau de bord qui obtient ses données d'une source exigeant une authentification.

D'un autre côté, certaines organisations utilisent Tableau Server comme point d'entrée unique géré pour les analystes de données. Dans ce scénario, l'intégration des informations d'identification peut faire sens pour l'entreprise. Tous les utilisateurs Tableau qui ont besoin d'accéder à la base de données peuvent utiliser l'ensemble unique d'informations d'identification qui est intégré dans les classeurs ou les sources de données.

Définir les autorisations de source de données

La publication de sources de données sur Tableau Server permet aux membres de votre équipe de fournir un accès centralisé aux données. Elle permet de partager des données entre des utilisateurs, y compris ceux qui n'utilisent pas Tableau Desktop, mais sont autorisés à modifier les classeurs dans l'environnement de modification Web. Les utilisateurs qui travaillent avec Tableau Desktop peuvent publier des sources de données contenant des extraits ou des connexions en direct.

En tant qu'administrateur, c'est vous qui déterminez les utilisateurs autorisés à publier des sources de données. Ces utilisateurs doivent avoir un rôle sur le site au moins égal au niveau Publicateur pour le site. En outre, les utilisateurs non-administrateurs doivent disposer des autorisations Afficher et Enregistrer pour le projet sur lequel ils souhaitent publier. (Pour savoir comment vérifier les autorisations d'un utilisateur, consultez le chapitre Structurer les projets de contenu, les groupes et les autorisations.)

Outre le choix des utilisateurs autorisés à publier des sources de données, vous pouvez définir des autorisations pour déterminer qui peut se connecter aux sources de données et qui peut les modifier. Vous pouvez configurer l'accès en définissant les rôles d'autorisations suivants pour le projet ou pour les sources de données individuelles :

  • Connecteur. Ce rôle d'autorisation définit les autorisations qui permettent à l'utilisateur ou au groupe de se connecter à la source de donnée depuis un classeur sur le serveur (création Web) ou dans Tableau Desktop.

  • Éditeur. Ce rôle d'autorisation définit des autorisations permettant à l'utilisateur ou au groupe de se connecter à la source de données sur le serveur et également de la publier, de l'éditer, de la télécharger, de la supprimer, de définir des autorisations et de planifier des actualisations pour la source de données.

Vous pouvez définir des autorisations pour des sources de données individuelles dans un projet uniquement si ce projet est déverrouillé. Comme indiqué dans le chapitre Structurer les projets de contenu, les groupes et les autorisations, nous vous recommandons de définir des autorisations au niveau du projet et de verrouiller les projets une fois que vous avez configuré les autorisations.

Pour définir des autorisations pour les sources de données d'un projet, procédez comme suit :

  1. Connectez-vous à Tableau Server.

  2. Cliquez sur le menu de site en haut de la page, puis sélectionnez le site à utiliser.

  3. Cliquez sur l'onglet Contenu, cliquez sur Projets, puis sélectionnez le projet pour lequel vous souhaitez définir des autorisations.

  4. Sous Actions, cliquez sur Autorisations.

  5. Sélectionnez ou ajoutez l'utilisateur ou le groupe auquel vous souhaitez attribuer des autorisations pour la source de données.

    Sous Sources de données, sélectionnez le rôle d'autorisation que vous souhaitez définir.

  6. Cliquez sur Enregistrer.

Partager des fichiers CSV, Excel ou Access via une connexion en direct

Certains de vos utilisateurs peuvent analyser les données de fichiers CSV (valeurs séparées par des virgules), Microsoft Excel ou Microsoft Access qui résident en tant que fichiers autonomes dans un dossier. Ces fichiers sont souvent traités comme une base de données. Par exemple, il se peut que plusieurs utilisateurs fassent appel à Tableau pour analyser les données d'un fichier Excel qui se trouve sur un emplacement réseau partagé et que quelqu'un (peut-être ces mêmes utilisateurs) mette également à jour fréquemment le fichier.

(Plus clairement, accéder à un fichier autonome sur un emplacement réseau partagé n'est pas la même chose qu'utiliser une base de données dédiée multi-utilisateur telle que SQL Server, MySQL ou Oracle. Les fichiers CSV, Excel et Access n'offrent pas le type de performances, la sécurité de niveau utilisateur et les fonctionnalités de requête complexes caractéristiques des bases de données relationnelles.)

La procédure que vous décrivons ici vous montre comment partager des fichiers Excel en utilisant un dossier partagé sur un ordinateur Windows fonctionnant dans un environnement Active Directory.

Dans ce scénario, le compte Exécuter en tant qu'utilisateur que vous avez créé et configuré pour Tableau Server est utilisé comme contexte de sécurité pour accéder au fichier Excel sur un emplacement réseau.

Configurer l'emplacement de réseau partagé

Accédez à la page Partager des fichiers avec quelqu'un(Link opens in a new window) sur le site Microsoft Windows et suivez la procédure décrite dans la section "Pour partager des fichiers et des dossiers dans un groupe de travail ou un domaine". Ces étapes décrivent comment utiliser l'assistant Partage de fichiers Windows pour créer un dossier partagé accessible depuis votre organisation à l'aide de la convention UNC (universal naming convention). Le nom UNC comprend un nom de serveur suivi d'un nom de dossier, à la manière d'une adresse Web, pour accéder à votre dossier partagé. Voici un exemple où DATATEAM est le nom de l'ordinateur et où shared est le nom de l'emplacement partagé sur cet ordinateur :

\\DATATEAM\shared

L'emplacement désigné par shared peut en fait se trouver à plusieurs niveaux plus bas dans la hiérarchie de dossiers, même si cela n'est pas reflété directement dans le nom UNC.

Lorsque vous exécutez l'assistant Partage de fichiers Windows, vous saisissez le compte d'utilisateur ou les comptes pour les personnes dont vous souhaitez partager le contenu. Pour cette procédure, entrez le compte Exécuter en tant qu'utilisateur, puis définissez le Niveau d'autorisation sur Lecture. Cela signifie que tout processus fonctionnant sous Exécuter en tant qu'utilisateur peut lire l'emplacement partagé. Dans notre cas bien entendu, ce processus est Tableau Server.

La dernière page de l'assistant Partage de fichiers affiche le chemin d'accès UNC. Notez ce chemin d'accès et envoyez-le aux utilisateurs afin qu'ils sachent où se connecter aux fichiers Excel partagés.

Ajouter le fichier Excel à l'emplacement partagé

Après avoir configuré l'emplacement partagé, copiez le fichier (ou les fichiers) Excel à partager sur cet emplacement.

Créer un classeur qui se connecte au fichier Excel partagé

Cette procédure décrit comment accéder à un fichier Excel sur l'emplacement réseau partagé et comment publier ensuite ces données dans un classeur sur Tableau Server. Cette procédure s'adresse à vos utilisateurs, vous devez vous assurer qu'ils savent comment suivre ces étapes.

Après que des utilisateurs ont publié en utilisant cette méthode, d'autres utilisateurs ayant accès au classeur publié verront les données provenant directement du fichier Excel partagé. Les utilisateurs peuvent également actualiser les données du fichier Excel tout en travaillant dans le classeur Tableau.

  1. Ouvrez Tableau Desktop. Sur la page de démarrage, sous Connexion, cliquez sur Excel.

  2. Dans la boîte de dialogue Ouvrir, saisissez le chemin d'accès UNC dans le champ Fichier en haut, en utilisant le format \\computer-name\share-location-name.

  3. Sélectionnez le classeur Excel auquel vous souhaitez vous connecter, puis cliquez sur Ouvrir.

  4. Créez un classeur Tableau comme vous le feriez d'habitude, mais n'extrayez pas les données à partir d'Excel.

  5. Pour publier, cliquez sur Serveur > Publier. Lorsque vous y êtes invité, saisissez l'adresse Tableau Server ainsi que les informations d'identification d'un utilisateur Tableau autorisé à publier.

  6. Dans la page Publier le classeur sur Tableau Server, désélectionnez la case à cocher Inclure les fichiers externes. Cliquez sur OK.

  7. Définissez des autorisations si nécessaire, puis cliquez sur Publier.

Garder les données à jour

Dans de nombreux cas, les données qui s'affichent dans le classeur ou la vue change après que l'utilisateur a publié le classeur. Par exemple, si un utilisateur a un classeur affichant les informations de ventes mensuelles, les données du classeur doivent être mises à jour tous les mois au minimum.

Si la source de données pour le classeur a été configurée de manière à utiliser une connexion en direct aux données, le classeur peut lire les données mises à jour à chaque fois que le classeur est ouvert. (C'est ce que nous vous avons montré dans la procédure précédant cette section.) Mais si la source de données du classeur est basée sur une connexion à un extrait, l'extrait doit être actualisé avec les données les plus récentes.

Lorsqu'un utilisateur publie un classeur avec un extrait, ce dernier est stocké sur le serveur. Les données sont ensuite incluses avec le classeur lorsqu'un utilisateur télécharge le classeur ou le visualise sur le serveur.

Vous pouvez actualiser un extrait de deux manières. Une actualisation complète remplace l'extrait actuel par de nouvelles données. Une actualisation incrémentielle ajoute les nouvelles données à l'extrait existant. (Pour prendre en charge les actualisations incrémentielles, les données doivent inclure des informations telles qu'un horodatage ou un ID séquentiel pouvant servir à indiquer le point de départ de l'actualisation incrémentielle).

Vos utilisateurs peuvent actualiser un extrait immédiatement dans Tableau Desktop en sélectionnant une source de données dans le menu Données puis en sélectionnant Extrait > Actualiser.

En tant qu'administrateur, vous pouvez également actualiser immédiatement les extraits :

  1. Connectez-vous à Tableau Server.

  2. En haut de la page, cliquez sur Tâches.

  3. Sous Actualisations des extraits, sélectionnez le classeur ou la source de données à actualiser.

  4. Dans le menu Actions, cliquez sur Exécuter maintenant.

Configurer des programmations d'actualisation au choix des utilisateurs

Lorsqu'un utilisateur publie un classeur incluant un extrait, l'utilisateur peut configurer une programmation d'actualisation. Ce paramètre est disponible dans la boîte de dialogue Publier le classeur dans Tableau Desktop.

En tant qu'administrateur, vous contrôlez la programmation d'actualisation qui est présentée aux utilisateurs lors de la publication (la zone sélectionnée dans la capture d'écran). Pour modifier les programmations d'actualisation que vos utilisateurs peuvent sélectionner, procédez comme suit :

  1. Connectez-vous à Tableau Server.

  2. En haut de la page, cliquez sur Programmations.

    • Désactivez, supprimez ou modifiez les programmations existantes que vous ne souhaitez pas conserver en sélectionnant la programmation, puis en cliquant sur l'action appropriée dans le menu Actions.

    • Créez une nouvelle programmation en cliquant sur Nouvelle programmation puis en configurant une programmation dans la boîte de dialogue Nouvelle programmation :

Déterminer la fréquence des actualisations programmées

L'actualisation d'un extrait peut être gourmand en ressources, tout particulièrement si vous tentez d'exécuter plusieurs actualisations d'extraits à la fois. De ce fait, il est généralement conseillé d'exécuter des actualisations d'extraits hors des jours ouvrables, et de les programmer à des fréquences aussi écartées que le permet votre activité. Une approche courante en matière d'extraits volumineux consiste à exécuter des programmations incrémentielles tous les soirs en dehors des heures ouvrables, puis d'exécuter une actualisation complète pendant le week-end.

Configurer la mise en cache des connexions de données

Lorsque vous planifiez votre stratégie en matière de sources de données, vous devez savoir comment Tableau Server met en cache les données de classeur hébergées sur le serveur. Il est particulièrement important de comprendre la mise en cache des connexions de données pour les organisations qui utilisent l'analyse en temps réel ou quasiment en temps réel.

Prenons un classeur disposant d'une connexion en direct à une base de données. Lorsque les utilisateurs interagissent avec les vues dans un navigateur Web, Tableau Server stocke les données renvoyées par les requêtes dans une mémoire cache. De cette manière, si l'interaction de l'utilisateur dans le classeur entraîne une requête qui a déjà été émise, Tableau peut tenter de lire les données à partir de la mémoire cache. L'obtention de données à partir de la mémoire cache est généralement plus rapide que la réexécution d'une requête, ce qui aide l'utilisateur à rester à flot dans ses analyses de données.

Par défaut, Tableau Server met en cache et réutilise les données aussi longtemps que possible. Pour configurer un comportement de mise en cache pour toutes les connexions de données :

  1. Exécutez la commande suivante pour définir le cache :

    tsm data-access caching set -r <value>

    <value> est l'une de ces options :

    • low ou chaîne vide (""). Il s'agit de la valeur par défaut. Tableau Server met en cache et réutilise les données aussi longtemps que possible.

    • <n>. Spécifie le nombre maximum de minutes pendant lequel les données devraient être mises en cache. Par exemple, tsm data-access caching set -r 2 définit le nombre maximum de minutes sur 2.

    • always ou 0 (zéro). L’une ou l’autre de ces valeurs configure l’actualisation du cache chaque fois qu'une page est rechargée.

  2. Appliquez les modifications. Exécutez la commande suivante :

    tsm pending-changes apply

Quelle que soit la méthode de mise en cache configurée, les utilisateurs de Tableau Desktop peuvent cliquer sur le bouton Actualiser les données de la barre d'outils pour forcer le serveur à envoyer une nouvelle requête et à récupérer les nouvelles données. En outre, les utilisateurs qui accèdent aux données via un navigateur Web peuvent ajouter le paramètre :refresh à leur URL.

Comprendre les arbitrages entre l'utilisation d'une connexion en direct et d'un extrait

L'objectif de ce chapitre est de vous guider pas à pas dans une stratégie de gestion des connexions et des sources de données. Une stratégie de ce type s'efforce de répondre à une question simple : pour un scénario donné, vos utilisateurs devraient-ils accéder aux données en direct ou utiliser des extraits ?

Tout d'abord, certaines sources de données n'autorisent pas les extraits, mais seulement les connexions en direct. Bien évidemment, si tel est le cas, vous n'avez pas besoin de choisir : utilisez la connexion en direct.

Mis à part ce choix simple, voici une réponse longue à une question simple. En expérimentant différentes approches et vous familiarisant avec les nombreuses variables affectant les performances, l'accès et l'actualité des données, ainsi que les avantages et inconvénients de bases de données spécifiques, vous formulerez une réponse qui marche pour les utilisateurs de votre organisation.

Nous comprenons toutefois votre besoin de connecter vos utilisateurs à des données aujourd'hui. Dans cette section, nous présentons quelques principes directeurs utiles pour prendre des décisions efficaces en matière d'accès lorsque vous déployez votre Tableau Server tout neuf.

Principe directeur : si les performances comptent moins que la fraîcheur des données, utilisez un extrait.

Les extraits sont très utiles pour assurer le flux de données à l'attention de vos analystes de données. Lorsqu'un extrait est intégré dans un classeur, toutes les données sont déjà disponibles pour Tableau Server, qui stocke l'extrait dans une base de données hautes performances. Il en résulte généralement des performances satisfaisantes. Lorsqu'ils font glisser les dimensions et les mesures, appliquent des filtres et ajoutent des visualisations, les utilisateurs peuvent voir les résultats sur le champ. Du fait que les utilisateurs interagissent avec un instantané des données et ne travaillent pas directement avec des données en direct, la source de données sous-jacente n'est pas sollicitée lorsque les utilisateurs analysent et visualisent les données dans Tableau.

Une remarque concernant l'utilisation de Tableau Server pour l'entreposage : si les classeurs utilisés par les personnes dans votre organisation sollicitent beaucoup la base de données avec des requêtes répétées de données actualisées, vous pourriez être tenté d'utiliser Tableau Server pour héberger des extraits et essayer ainsi de décharger les requêtes des bases de données relationnelles utilisées. Nous déconseillons généralement d'utiliser des extraits simplement pour décharger les requêtes. Ce n'est pas une utilisation économique de Tableau Server, qui est conçu pour l'analyse des données, et non pas leur entreprosage. Si vous constatez que les utilisateurs créent un grand nombre d'extraits parce que les performances souffrent de l'utilisation de connexions en direct aux données, vous devriez envisager des optimisations de performances au niveau de la base de données plutôt que d'entreposer des extraits sur Tableau Server.

Principe directeur : si vous avez besoin de données en temps réel pour vos décisions stratégiques, utilisez une connexion en direct

De nombreux scénarios d'analyse de données exigent des données en temps réel. Par exemple, les opérations financières modélisant les transactions pendant les heures de trading exigent généralement des données en temps réel. De même, les scénarios de sondages nécessitent souvent une actualisation des données quasiment en temps réel afin de fournir des analyses rapides. En règle générale, si les analyses de données sur lesquelles vos utilisateurs travaillent exigent des données actuelles, c'est-à-dire mesurées en minutes ou en secondes, il est conseillé de créer les classeurs en utilisant une connexion en direct.

Les extraits peuvent être actualisés fréquemment, mais comme nous l'avons expliqué précédemment, ces mises à jour peuvent utiliser beaucoup de ressources du processeur et ralentir les performances du serveur. Dans le même temps, l'utilisation intensive des connexions en direct, tout particulièrement avec des classeurs complexes, peut peser sur les bases de données classiques. Vous devez vous vous assurer que les processus Tableau Server sont correctement dimensionnés pour l'utilisation intensive des connexions en direct et que vos bases de données peuvent gérer la charge de requêtes de Tableau Server. (Pour des informations sur le réglage de votre serveur, consultez le chapitre Notifications, surveillance et réglage.)

Gardez à l'esprit que les résultats des requêtes utilisant des connexions en direct peuvent être mis en cache sur le serveur. Donc, si vous avez besoin de données véritablement en temps réel, veillez à configurer une actualisation plus fréquente du cache, comme expliqué précédemment dans Configurer la mise en cache des connexions de données.

Principe directeur : si un classeur contient des données sensibles, utilisez une connexion en direct

Comme indiqué précédemment, vous devez décider si vous allez autoriser les utilisateurs à intégrer les informations d'identification dans les classeurs et les sources de données lorsqu'ils font une publication. La politique de sécurité et de confidentialité de votre organisation doit déterminer si vous autorisez ou non les utilisateurs à intégrer les informations d'identification.

Si votre organisation applique les autorisations de niveau utilisateur aux bases de données, utilisez une connexion en direct pour les classeurs qui se connectent à ces bases de données. De cette manière, les utilisateurs qui interagissent avec les classeurs et les sources de données exigeant une authentification seront invités à saisir leurs informations d'identification. Pour les sources de données autorisant l'accès Exécuter en tant qu'utilisateur, par exemple SQL Server, Microsoft Analysis Services et Oracle, vérifiez que vous avez configuré le compte Exécuter en tant qu'utilisateur avec l'accès approprié aux ressources de base de données.

Comparer les performances des extraits et des connexions en direct

Les gens se posent souvent la question de savoir ce qui est plus rapide : un extrait ou une connexion en direct ? Si vous avez lu tout ce qui précède, vous savez que la réponse est : "cela dépend".

Au bout du compte, la meilleure manière de répondre à cette question est de créer un classeur avec une connexion en direct à votre base de données. Dans la plupart des cas, les différences de performances sont évidentes lorsque vous créez votre classeur et affichez les résultats.

Pour une analyse plus approfondie, Tableau inclut des outils (voir le complément d'informations ci-après) que vous pouvez utiliser pour mesurer les performances des classeurs à la fois sur Tableau Server et Tableau Desktop. Utilisez ces outils pour déterminer les performances du classeur qui utilise la connexion en direct. Lorsque vous avez obtenu ces données, modifiez le classeur de manière à utiliser un extrait puis à mesurer à nouveau les performances.

Lorsque vous comparez ces résultats, un gagnant émerge sans conteste. Si les résultats sont proches, vous pouvez utiliser les données pour explorer les possibilités d'améliorer les performances. Par exemple, vous pourrez voir clairement qui l'emporte en appliquant un filtre pour utiliser uniquement le sous-ensemble de données requis par le classeur.

Voici quelques liens de l'aide de Tableau et de l'aide de Tableau Server pour des informations sur l'exécution et l'interprétation d'un enregistrement des performances :

Passez à la section Notifications, surveillance et réglage.

Merci de vos commentaires !