Tipps für die Arbeit mit Daten
Daten können auf unterschiedliche Weise organisiert werden. Um die Vorteile von Tableau Desktop nutzen zu können, empfiehlt Tableau, eine Verbindung zu Daten herzustellen, die für die Analyse formatiert sind. Dabei handelt es sich insbesondere um Daten, die:
möglichst detailliert statt aggregiert sind (beispielsweise tägliche Wetterdaten anstelle von monatlichen Durchschnittswerten),
wie eine Datenbanktabelle organisiert sind (anstelle einer nach Spalten ausgerichteten Tabelle, wie dies bei einer Kreuztabelle der Fall ist),
keine irrelevanten Informationen mehr enthalten (alles, was keine Daten und die zugehörigen Kopfzeilen sind).
Wenn die Daten für die Analyse strukturiert sind, ist es deutlich einfacher, Fragen zu stellen und zu beantworten. Tableau kann Rohdaten auf der gewünschten Ebene aggregieren, anstatt durch Aggregationen eingeschränkt zu werden, die bereits in den Daten vorhanden sind. Es können nach Bedarf Gruppen und Hierarchien erstellt werden, und im Schema der Analyse können Berechnung durchgeführt werden.
Tableau Desktop enthält grundlegende Bereinigungsoptionen und den Data Interpreter. Für komplexere Formatierungsaufgaben wird möglicherweise Tableau Prep benötigt.
In den folgenden Tableau Desktop-spezifischen Abschnitten werden häufige Formatierungen und Probleme beschrieben, die die Datenanalyse erschweren, sowie Fehlerbehebungsmaßnahmen dazu angeboten.
Pivot-Daten im Kreuztabellenformat
Wenn Daten als Kreuztabelle formatiert sind, dann ist die Tabelle nach Spalten ausgerichtet. In einer nach Spalten ausgerichteten Tabelle werden die Variablen als Spaltenüberschriften gespeichert. Tableau Desktop ist jedoch für nach Zeilen ausgerichtete Daten optimiert. In einer nach Zeilen ausgerichteten Tabelle werden die Variablen in den Zeilenwerten gespeichert.
Angenommen, Sie haben eine nach Spalten ausgerichtete Tabelle, in der Noten für Mathematik, Wissenschaft und Geschichte für Grundschüler angezeigt werden.
Tableau Desktop ist für eine Verbindung mit nach Zeilen ausgerichteten Daten optimiert, die Werte für Mathematik, Wissenschaft und Geschichte sind jedoch unter einer Spalte angeordnet, die mit "Fach" benannt ist,und die Noten für jeden Schüler befinden sich unter einer Spalte mit dem Namen "Note". Sie können die Spalten in Zeilen pivotieren, indem Sie die Excel-Daten manuell bearbeiten. Oder Sie stellen alternativ eine Verbindung mit den Excel-Daten von Desktop aus her und verwenden die Pivotoption. Weitere Informationen zur Pivotoption finden Sie unter Pivotieren von Daten von Spalten in Zeilen.
Entfernen voraggregierter Daten
Häufig stehen Daten in voraggregiertem Format zur Verfügung, d. h. Daten können Summen, Durchschnitts- oder Medianwerte usw. enthalten. Ein häufig verbreitetes Beispiel für voraggregierte Daten sind Zwischenwerte und Gesamtwerte. Zwischen- und Gesamtwerte werden aus den Rohdaten berechnet, sind jedoch nicht Teil der eigentlichen Rohdaten.
Angenommen, Ihre Tabelle enthält eine Zeile mit Gesamtwertinformationen.
In diesem Fall müssen die voraggregierten Daten entfernt werden. Um Zwischen- und Gesamtwerte in Ihrer Analyse verwenden zu können, müssen Sie diesen Informationstyp manuell aus Ihrer Tabelle entfernen. Verbinden Sie sich dann von Desktop aus mit den Excel-Daten, und berechnen Sie Zwischen- und Gesamtwerte mithilfe der Option für Gesamtwerte. Weitere Informationen finden Sie im Thema über das Anzeigen von Gesamtsummen in einer Visualisierung.. Alternativ können Sie eine Verbindung mit den Excel-Daten von Desktop aus herstellen, den Data Interpreter aktivieren und dann die Option für Gesamtwerte verwenden. Weitere Informationen finden Sie unter Bereinigen von Daten aus Excel, CSV, PDF und Google Tabellen mit dem Data Interpreter.
Entfernen oder Ausschließen von einleitendem Text
Die Excel-Daten werden als Bericht bereitgestellt und können Titel oder Blöcke mit einleitendem Text enthalten. Da Desktop in der ersten Tabellenzeile Spaltenüberschriften oder Zeilenwerte erwartet, können solche Informationen bei Analysen zu Problemen führen.
Nehmen Sie beispielsweise an, Ihre Tabelle enthält einen Berichtstitel und ein Datum.
In diesem Fall müssen die Titel- und Datumsinformationen entfernt werden. Um für einen Bericht einen Titel und ein Datum verwenden zu können, gehen Sie wie folgt vor:
- Entfernen Sie diese Informationen manuell aus Ihren Excel-Daten. Stellen Sie von Desktop aus eine Verbindung mit den Excel-Daten her, und fügen Sie dann mithilfe der Titeloption einen Berichtstitel hinzu. Weitere Informationen finden Sie unter Formatieren von einzelnen Teilen der Ansicht.
- Stellen Sie von Desktop aus eine Verbindung mit den Excel-Daten her, aktivieren Sie den Data Interpreter, und verwenden Sie dann die Titeloption. Weitere Informationen finden Sie unter Bereinigen von Daten aus Excel, CSV, PDF und Google Tabellen mit dem Data Interpreter.
- Wenn Sie diese Informationen nicht aus den Excel-Daten entfernen können, erstellen Sie einen benannten Bereich und stellen dann von Desktop aus eine Verbindung mit dem benannten Bereich her. Weitere Informationen finden Sie unter Excel.
Abflachen hierarchischer Kopfzeilen auf eine einzelne Zeile
Im Allgemeinen erwartet Tableau Desktop nur in der ersten Zeile eines Excel-Arbeitsblatts Spaltenüberschriften. Daten, die Spaltenüberschriften in mehreren Ebenen enthalten, können bei Analysen zu Problemen führen.
Nehmen Sie beispielsweise an, Sie verfügen über eine Tabelle, die eine Hauptüberschrift und mehrere Unterüberschriften enthält.
In diesem Fall muss die Hierarchie der Überschriften auf eine Ebene reduziert oder entfernt werden. Dafür können Sie direkt in der Excel-Tabelle manuell neue Spalten für jede Überschrift in der Hierarchie erstellen. Oder Sie verbinden sich alternativ von Tableau Desktop aus mit den Excel-Daten und aktivieren den Data Interpreter. Stellen Sie sicher, dass die Überschriften ordnungsgemäß auf eine Ebene reduziert wurden. Weitere Informationen zum Data Interpreter finden Sie unter Bereinigen von Daten aus Excel, CSV, PDF und Google Tabellen mit dem Data Interpreter.
Überprüfen auf leere Zellen
Wenn Sie für hierarchische Überschriften neue Spalten erstellen, stellen Sie sicher, dass jede Zelle in den neuen Spalten Werte enthält.
Wenn Sie ggf. den gleichen Wert für jede Zeile eingeben, ist es wichtig, dass in jeder Zeile die Daten enthalten sind, die sie mit den in der hierarchischen Überschrift enthaltenen Daten verbindet. Leere Zellen müssen manuell aus der Excel-Tabelle entfernt werden.
Entfernen von leeren Zeilen
Stellen Sie sicher, dass sich in der Datensammlung keine leeren Zeilen befinden. Um leere Zeilen zu entfernen, müssen Sie diese aus den Excel-Daten entfernen.
Hinzufügen fehlender Kopfzeilen
Stellen Sie sicher, dass für jede Spalte eine Spaltenüberschrift vorhanden ist. Um fehlende Überschriften hinzuzufügen, müssen Sie diese direkt in den Excel-Daten manuell hinzufügen.