Analyse avec la seconde date dans Tableau Desktop

Ceci est la seconde étape du didacticiel et présuppose que vous avez terminé la première étape, Trouver la seconde date avec Tableau Prep.

Lors de la première étape, nous avons examiné notre ensemble de données d’origine et l’avons structuré de manière à pouvoir répondre aux questions suivantes :

  1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque conducteur ?

  2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils corrélés ?

  3. Quel conducteur a eu la plus grosse amende ? Lequel a eu l’amende la plus faible ?

  4. Combien de conducteurs ont commis plusieurs types d’infractions ?

  5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de stage de conduite obligatoire ?

À mesure que nous explorions ces questions, il est apparu clairement que la première structure des données que nous avions créée présentait quelques avantages et quelques inconvénients. Nous retournerons dans Tableau Prep Builder et effectuerons quelques mises en forme supplémentaires, puis nous verrons l’incidence qu’a cette action sur la même analyse dans Tableau Desktop. Enfin, nous adopterons une approche strictement Tableau Desktop de l’analyse en utilisant les expression de niveau de détail (LOD) avec les données d’origine.

L’objectif de ce didacticiel est de présenter divers concepts dans le contexte d’un scénario de la vie réelle et d’explorer les options, en déterminant de manière non prescriptive quelle est la plus adaptée. Au terme de ce didacticiel, vous devriez mieux appréhender l’incidence de la structure des données sur les calculs et l’analyse, et être familiarisé avec divers aspects de Tableau Prep et les calculs dans Tableau Desktop.

Remarque : pour effectuer les tâches décrites dans ce didacticiel, vous aurez besoin d’installer Tableau Prep Builder et, de manière facultative, Tableau Desktop, et de télécharger les données.

Pour installer Tableau Prep et Tableau Desktop avant de poursuivre ce didacticiel, consultez le Guide de déploiement de Tableau Desktop et Tableau Prep(Le lien s’ouvre dans une nouvelle fenêtre). Sinon, vous pouvez télécharger les versions d’évaluation gratuites de Tableau Prep(Le lien s’ouvre dans une nouvelle fenêtre) et Tableau Desktop(Le lien s’ouvre dans une nouvelle fenêtre).

L’ensemble de données est la sortie de Driver Infractions.tflx, telle que nous l’avons créée dans la première étape.

Analyse dans Tableau Desktop

Maintenant que nous avons configuré nos données, nous allons les introduire dans Tableau Desktop. Nous pouvons facilement répondre à quelques questions, mais d’autres impliquent quelques calculs (ou beaucoup de calculs). Exercez-vous avec les questions ci-dessous. Vous pouvez développer les informations de base pour chacune d’elles et apprendre comment procéder si vous êtes bloqué.

Remarque : vous pouvez télécharger le classeur Driver Infractions.twbx(Le lien s’ouvre dans une nouvelle fenêtre) pour examiner les solutions en contexte. Gardez à l’esprit qu’il peut y avoir des moyens alternatifs d’interpréter l’analyse ou d’obtenir des réponses.

1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque conducteur ?
2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils corrélés ?
3. Quel conducteur a eu la plus grosse amende ? Lequel a eu l’amende la plus faible ?
4. Combien de conducteurs ont commis plusieurs types d’infractions ?
5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de stage de conduite obligatoire ?

Aller plus loin—Données permutées

Si les données avec lesquelles nous avons travaillé sont bien structurées pour répondre à des questions centrées spécifiquement sur les premières et secondes infractions, ce n’est pas la structure standard recommandée à utiliser avec Tableau Desktop. Plus notre analyse s’écarte des questions de base sur les dates des infractions, plus nos calculs se complexifient pour combiner les informations pertinentes sous une forme utilisable.

En règle générale, lorsque les données sont stockées avec plusieurs colonnes pour le même type de données (par exemple deux colonnes pour la date, deux colonnes pour le montant de l’amende, etc.) et que des informations uniques sont stockées dans le nom du champ (par exemple s’il s’agit de la première ou de la seconde infraction), ceci indique que les données devraient être permutées.

Une permutation multiple dans Tableau Prep Builder peut gérer cette tâche avec efficacité. Nous pouvons travailler à partir de la fin du flux Driver Infraction que Tableau Prep a créé dans le didacticiel précédent Trouver la seconde date avec Tableau Prep.

Conseil : veillez à revenir dans Tableau Prep pour les étapes suivantes.

  1. Depuis l’étape de nettoyage finale, ajoutez une étape Permutation pour permuter chaque champ dupliqué. Utilisez l’icône plus en haut à droite de la zone Champs permutés pour ajouter d’autres Valeurs de permutation. Chaque ensemble de champ (par exemple les montants de 1ère et 2nd amende) devrait être permuté ensemble.

    Pour plus d’informations sur la permutation, consultez Nettoyer et organiser les données.

  2. Dans la zone Champs pivotés, sous la colonne Noms Pivot1, cliquez deux fois sur chaque valeur et renommez-les en 1ère et 2nde.

    Volet de configuration Permutation 1 dans Tableau Prep affichant les cinq permutations

Les résultats peuvent être mis en ordre en supprimant les dates null et en renommant et réorganisant les champs.

  1. Ajoutez une étape de nettoyage après la permutation. Dans la colonne Infraction Date, faites un clic droit sur la barre null et choisissez Exclure.

  2. Double-cliquez sur le nom du champ Pivot1 Names et renommez-le Infraction Number.

  3. Faites glisser les champs comme approprié pour les réorganiser comme ci-dessous :

    Aperçu des données permutées et nettoyées

  1. À partir des nouvelles données permutées, créez une sortie appelée Pivoted Driver Infractions (Infractions des conducteurs Données permutées) et insérez-la dans Tableau Desktop. (N’oubliez pas d’exécuter le flux après avoir ajouté l’étape Sortie.)

Nous pouvons maintenant examiner nos cinq questions à nouveau en nous basant sur cette structure de données permutées. Vous pouvez développer chacune des informations de base pour savoir comment procéder si vous êtes bloqué.

Remarque : vous pouvez télécharger le fichier de flux terminé Pivoted Driver Infractions.tflx pour vérifier votre travail, ou télécharger le classeur Pivoted Driver Infractions.twbx pour examiner les solutions en contexte. Gardez à l’esprit qu’il peut y avoir des moyens alternatifs d’interpréter l’analyse ou d’obtenir des réponses.

1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque conducteur ?
2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils corrélés ?
3. Quel conducteur a eu la plus grosse amende ? Lequel a eu l’amende la plus faible ?
4. Combien de conducteurs ont commis plusieurs types d’infractions ?
5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de stage de conduite obligatoire ?

Avantages des données permutées

Nous pourrions nous en tenir à la structure de données d’origine du didacticiel s’il n’y avait que des questions auxquelles cette structure permettrait de répondre facilement. Mais le format de données permutées est plus flexible. Même s’il exige quelques calculs, une fois en place, l’ensemble de données résultant est bien adapté pour répondre à des questions plus larges.

Aller encore plus loin—Calculs seulement

Que faire si vous n’avez pas accès à Tableau Prep Builder ? La situation est-elle désespérée si vous êtes bloqué avec les données d’origine ? Absolument pas !

Tableau Desktop et les expressions LOD peuvent répondre à toutes vos questions analytiques. Si nous nous connectons au fichier Traffic Violations.xlsx(Le lien s’ouvre dans une nouvelle fenêtre) d’origine, il semble très similaire à l’ensemble de données permutées, à l’exception du champ crucial Infraction Number. Nous devons reproduire le résultat des étapes d’agrégation via les expressions LOD.

Remarque : vous pouvez télécharger le classeur LOD Driver Infractions.twbx(Le lien s’ouvre dans une nouvelle fenêtre) pour examiner les solutions en contexte. Gardez à l’esprit qu’il peut y avoir des moyens alternatifs d’interpréter l’analyse ou d’obtenir des réponses.

1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque conducteur ?
2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils corrélés ?
3. Quel conducteur a eu la plus grosse amende ? Lequel a eu l’amende la plus faible ?
4. Combien de conducteurs ont commis plusieurs types d’infractions ?
5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de stage de conduite obligatoire ?

Il est important de se rappeler que cette solution comporte de nombreux calculs imbriqués et expressions LOD. Selon la taille de l’ensemble de données et la complexité des données, les performances peuvent poser problème.

Réflexions sur les méthodes

Donc, quelle voie choisir ? C’est à vous de décider, en fonction aussi des outils dont vous disposez.

  • Si vous souhaitez éviter les expressions LOD, il existe une solution d’organisation des données, même si des calculs peuvent s’avérer nécessaires pour certaines analyses (Analyse dans Tableau Desktop).

  • Si vous pouvez organiser les données et que vous maîtrisez les calculs, y compris les expressions LOD, l’option intermédiaire offre la flexibilité optimale (Aller plus loin—Données permutées).

  • Si vous êtes à l’aise avec les expressions LOD, l’impact sur les performances est minimal, et/ou si vous n’avez pas accès à Tableau Prep, résoudre la question avec les seules expressions LOD est une option tout à fait viable (Aller encore plus loin—Calculs seulement).

Au minimum, il est utile de comprendre comment l’agrégation dans Tableau Prep et les expressions LOD dans Tableau Desktop sont liées ensemble et affectent l’analyse des données. Comme pour la plupart des choses avec Tableau, il existe plusieurs manières de procéder. Explorer toutes les options possibles peut vous aider à rassembler les concepts et à choisir la solution la plus adaptée à votre cas.

Calculs utilisés :

Remarque : nous tenons à remercier Ann Jackson pour sa rubrique Workout Wednesday Do Customers Spend More on Their First or Second Purchase?(Le lien s’ouvre dans une nouvelle fenêtre) et Andy Kriebel pour son astuce Tableau Prep Returning the First and Second Purchase Dates(Le lien s’ouvre dans une nouvelle fenêtre) qui ont fourni l’inspiration initiale pour ce didacticiel. Si vous cliquez sur ces liens, vous quitterez le site Web de Tableau. Tableau décline toute responsabilité quant au degré d’exactitude ou d’actualité des pages gérées par des fournisseurs externes. Contactez les propriétaires si vous avez des questions relatives au contenu.