Conseils d’utilisation de vos données

Vous pouvez organiser les données de différentes manières. Pour tirer parti de Tableau Desktop, Tableau vous recommande de vous connecter à des données qui ont été mises en forme pour l’analyse. Plus spécifiquement, il s’agit de données qui sont :

  • aussi granulaires que possibles, plutôt qu’agrégées (par exemple des données météorologiques quotidiennes plutôt que des moyennes mensuelles)

  • organisées comme une table de base de données (plutôt qu’une table orientée en colonnes, par exemple un tableau croisé)

  • nettoyées des données superflues (tout ce qui n’est pas les données et leurs en-têtes)

Lorsque les données sont structurées pour l’analyse, il est beaucoup plus facile de poser des questions et d’y répondre. Tableau peut agréger les données brutes au niveau souhaité plutôt que d’être limité par les agrégations déjà présentes dans les données. Des groupes et des hiérarchies peuvent être créés selon les besoins, et les calculs peuvent être effectués dans le flux d’analyse.

Tableau Desktop propose des options de nettoyage de base et l’Interpréteur de données. Tableau Prep peut s’avérer nécessaire pour les problèmes de mise en forme plus complexes.

Les sections suivantes spécifiques à Tableau Desktop proposent des explications et des suggestions pour vous aider à résoudre des problèmes de mise en forme courants ou des problèmes qui rendent difficile l’analyse de vos données.

Permuter les données dans un format de tableau croisé

Lorsque les données sont mises en forme comme dans un tableau croisé, la table est orientée en colonnes. Dans une table orientée en colonnes, les variables sont stockées en tant qu’en-têtes de colonne. Toutefois, Tableau Desktop est optimisé pour des données orientées en lignes. Dans une table orientée en lignes, les variables sont stockées dans les valeurs de lignes.

Par exemple, supposons une table orientée colonnes, qui affiche les résultats d’élèves d’école primaire en mathématiques, science et histoire.

Tableau croisé indiquant le numéro d’identification de l’élève, le sexe, la région de l’école et trois matières (mathématiques, sciences et histoire) pour trois élèves. Les colonnes des matières sont surlignées en orange pâle.

Tableau Desktop est optimisé pour se connecter à des tables orientées lignes, où les valeurs de mathématiques, science et histoire sont organisées sous une colonne appelée « Subject » et les résultats pour chaque élève sont organisés sous une colonne appelée « Score ». Vous pouvez permuter les colonnes dans les lignes, en modifiant manuellement vos données Excel. Sinon, vous pouvez vous connecter à vos données Excel depuis Desktop, puis utiliser l’option de permutation. Pour plus d’informations sur l’option de permutation, consultez Permuter les données de colonnes en lignes.

Exemple de tableau croisé dynamique affichant le numéro d’identification de l’étudiant, le sexe, la région de l’école, la matière étudiée et la note.

Supprimer les données pré-agrégées

Les données se présentent souvent sous forme pré-agrégée, c’est-à-dire que les données peuvent contenir des sommes, des moyennes, des médianes, etc. Un exemple courant de données pré-agrégées se présente sous la forme de sous-totaux et de totaux généraux. Les sous-totaux et les totaux généraux sont calculés à partir des données brutes, mais ne font pas partie des données brutes elles-mêmes.

Par exemple, supposons que vous ayez une table contenant une ligne d’informations de sous-totaux.

Tableau croisé indiquant le numéro d’identification de l’élève, le sexe, la région de l’école et trois matières (mathématiques, sciences et histoire) pour cinq élèves. Une ligne de sous-totaux surlignée en orange pâle au bas du tableau indique la somme des scores des élèves dans chaque matière.

Dans ce cas, les données pré-agrégées ont besoin d’être supprimées. Pour utiliser les sous-totaux et les totaux généraux dans votre analyse, supprimez manuellement ce type d’information de votre table. Ensuite, connectez-vous à vos données Excel depuis Desktop et calculez les sous-totaux et les totaux à l’aide de l’option Totaux. Pour plus d’informations, consultez Afficher les totaux dans une visualisation. Sinon, vous pouvez vous connecter à vos données Excel depuis Desktop, activer l’Interpréteur de données, puis utiliser l’option Totaux. Pour plus d’informations, consultez Nettoyer les données de fichiers Excel, CSV, PDF et Google Sheets à l’aide de l’Interpréteur de données.

Tableau croisé indiquant le numéro d’identification de l’élève, le sexe, la région de l’école et trois matières (mathématiques, sciences et histoire) pour cinq élèves. Une ligne de sous-totaux surlignée en orange pâle au bas du tableau indique la somme des scores des élèves dans chaque matière, et la ligne est barrée en rouge.

Supprimer ou exclure le texte d’introduction

Les données Excel qui sont transmises sous forme de rapport peuvent contenir des titres ou des blocs de texte d’introduction. Parce que Desktop attend des en-têtes de colonnes ou des valeurs de lignes dans la première ligne d’une table, ces informations peuvent provoquer des problèmes lors de votre analyse.

Par exemple, supposons que vous ayez une table contenant un titre et une date de rapport.

Exemple de tableau croisé dynamique avec les détails du coin supérieur surlignés en orange pâle, avec le titre « Excel Report, January 2017 ».

Dans ce cas, les informations de titre et de date doivent être supprimées. Pour utiliser un titre et une date pour un rapport, effectuez l’une des opérations suivantes :

Exemple de tableau croisé dont les détails inutiles dans le coin supérieur sont barrés en rouge. Ces détails sont intitulés « Excel Report, January 2017 ».

Aplatir les en-têtes hiérarchiques sur une seule ligne

En général, Tableau Desktop s’attend à ce que seule la première ligne de vos données Excel contienne des en-têtes de colonnes. Les données contenant plusieurs couches d’en-têtes de colonne peuvent provoquer des problèmes lors de votre analyse.

Par exemple, supposons que vous ayez une table contenant un en-tête principal et plusieurs en-têtes secondaires.

Tableau croisé indiquant le numéro d’identification de l’élève, le sexe, la région de l’école et trois matières (mathématiques, sciences et histoire) pour quatre élèves. Un en-tête de tableau sur lequel on peut lire « California » est surligné en orange pâle en haut du tableau.

Dans ce cas, la hiérarchie des en-têtes doit être aplatie ou supprimée. Pour cela, vous pouvez créer manuellement une nouvelle colonne pour chaque en-tête dans la hiérarchie directement dans vos données Excel. Sinon, connectez-vous à vos données Excel depuis Tableau Desktop, puis activez l’Interpréteur de données. Vérifiez que vos en-têtes sont correctement aplatis. Pour plus d’informations sur l’Interpréteur de données, consultez Nettoyer les données de fichiers Excel, CSV, PDF et Google Sheets à l’aide de l’Interpréteur de données.

Tableau croisé qui affiche les identifiants des étudiants, les États, les sexes, les écoles et les résultats aux tests. La colonne État est surlignée en vert pâle.

Assurez-vous qu’il n’y a pas de cellules vides.

Si vous créez de nouvelles colonnes pour vos en-têtes hiérarchiques, assurez-vous que chaque cellule dans les nouvelles colonnes contiennent des valeurs.

Exemple de tableau croisé dynamique affichant le numéro d’identification de l’étudiant, le sexe, la région de l’école, la matière étudiée et la note. La colonne État est surlignée en orange pâle et sur les dix lignes totales de la colonne, seules huit d’entre elles contiennent du texte.

Si vous pouvez répéter la même valeur pour chaque ligne, il est important que chaque ligne contienne les données qui y sont associées avec les données stockées dans l’en-tête hiérarchique. Vous devez supprimer manuellement les cellules vides de vos données Excel.

Exemple de tableau croisé dynamique affichant le numéro d’identification de l’étudiant, le sexe, la région de l’école, la matière étudiée et la note. La colonne État est surlignée en vert pâle et des États figurent dans chacune des dix lignes.

Supprimer les lignes vides

Assurez-vous que vos données ne contiennent pas de lignes vides. Pour corriger les lignes vides, vous devez supprimer les lignes vides de vos données Excel.

Exemple de tableau croisé dynamique affichant le numéro d’identification de l’étudiant, le sexe, la région de l’école, la matière étudiée et la note. Il y a deux lignes vides surlignées en orange pâle.

Ajouter des en-têtes manquants

Assurez-vous qu’il n’y a pas d’en-têtes de colonnes manquants. Pour corriger les en-têtes manquants, vous devez ajouter manuellement les en-têtes manquants à vos données Excel.

Exemple de tableau croisé dynamique affichant le numéro d’identification de l’étudiant, le sexe, la région de l’école, la matière étudiée et la note. Deux en-têtes de colonnes vides sont surlignés en orange pâle.