Beheben von Fehlern in Vorhersagemodellierungsfunktionen
Bei der Verwendung von Vorhersagemodellierungsfunktionen in Tableau können Fehler auftreten, wenn Sie versuchen, die Berechnungen einer Visualisierung hinzuzufügen. Häufig ist dies auf die Kombination von Prädiktoren und visualisierten Elementen zurückzuführen, was zu einer mathematisch ungültigen Berechnung führt.
Generell müssen Sie als Erstes versuchen, die Dimension Berechnen per zu überprüfen. Stellen Sie als Nächstes sicher, dass keine Nichtübereinstimmung zwischen der in den Prädiktoren angegebenen Detailgenauigkeit und der Detailgenauigkeit in der Ansicht besteht. Stellen Sie außerdem sicher, dass Ihre Prädiktoren anhand der aktuellen Visualisierung relevante Daten für das Modell bereitstellen.
In diesem Artikel finden Sie eine detaillierte Beschreibung zu einigen häufigen Problemen und Methoden zu deren Behebung.
Fehler bei den Vorhersagemodellierungsfunktionen werden je nach verwendetem Modell in der Regel durch eines oder mehrere der folgenden Probleme verursacht:
Allgemeine Fehler
- Ungültige Dimension "Berechnen per"
- Konflikt zwischen Dimensionsprädiktoren und der visualisierten Detailgenauigkeit
- Mehrere Prädiktoren stehen miteinander in Konflikt
- Es sind nicht genügend Daten vorhanden, um ein Modell zu erstellen
- Anhand der bereitgestellten Daten konnte kein erfolgreiches Modell erstellt werden
Fehler bei der gaußschen Prozessregression
- Die gaußsche Prozessregression erfordert genau einen geordneten Dimensionsprädiktor
- Die gaußsche Prozessregression unterstützt nur Dimensionen als Prädiktoren
- Es gibt keine Schulungsdaten für ein oder mehrere Vorhersageziele
- Es gibt mehr als 5.000 Markierungen
Ungültige Dimension "Berechnen per"
Beim Visualisieren einer Vorhersagemodellierungsfunktion muss eine Dimension vom Typ "Berechnen per" angegeben werden. Es wird empfohlen, eine bestimmte Dimension (z. B. Region oder Kategorie) anstelle einer Richtungsdimension (z. B. Tabelle (horizontal, dann vertikal) oder Bereich (horizontal)) auszuwählen.
Da eine Visualisierung oder ein Dashboard mehrere Vorhersageberechnungen beinhalten kann, wird durch Auswahl einer spezifischen Partitionierungsdimension sichergestellt, dass Sie Modelle anhand desselben zugrunde liegende Datensatzes für alle individuellen Funktionen erstellen und somit Ergebnisse aus ähnlichen Modellen vergleichen.
Weitere Informationen zur Adressierung und Partitionierung finden Sie unter Umwandeln von Werten mit Tabellenberechnungen.
Beim Arbeiten mit Vorhersagemodellierungsfunktionen müssen Sie sicherstellen, dass die verschiedenen Instanziierungen konstant bleiben, sowohl in verschiedenen Iterationen Ihres Modells (z. B. bei Auswahl verschiedener Prädiktoren) als auch in verschiedenen Visualisierungen. Bei Verwendung der Richtungsdimensionen für "Berechnen per" ist es möglich, dass sich eine triviale Änderung Ihrer visualisierten Daten erheblich auf die zum Erstellen des Modells verwendeten Daten auswirkt. Dadurch werden ihre Gültigkeit und Konsistenz in verschiedenen Visualisierungen beeinträchtigt.
Es werden möglicherweise Nullwerte angezeigt, wenn keine Dimension vom Typ "Berechnen per" angegeben wurde oder wenn eine ungültige Dimension vom Typ "Berechnen per" ausgewählt wurde.
Ungültige Dimensionen vom Typ "Berechnen per" beinhalten Folgendes:
- Zelle: Diese Dimension führt immer dazu, dass ein einzelner Datenpunkt zum Erstellen eines Modells verwendet wird und dass dieser Vorgang nicht erfolgreich ist.
- Eine verschachtelte Dimension auf höherer Ebene (wenn z. B. Region und State auf einer Achse visualisiert sind, wobei zwar Markierungen für State generiert, jedoch nach Region gruppiert werden.) Wenn Region als Partitionierungsdimension ausgewählt ist, werden Nullwerte zurückgegeben, da in dieser Ansicht keine Markierungen für Region formalisiert sind.
In der Visualisierung oben sind State und Category gültige Dimensionen für "Berechnen per". Die Partitionierung der Daten nach State oder Category ergibt mehrere gültige Markierungen, die zum Erstellen eines Modells verwendet werden können.
Region wird zwar als Option für "Berechnen mit" aufgeführt, generiert jedoch keine Markierungen mit der Detailgenauigkeit dieser Ansicht und kann nicht zum Partitionieren der Daten verwendet werden.
Weitere Informationen finden Sie unter "Berechnen per" und Datenpartitionierung in der Vorhersagemodellierung.
Konflikt zwischen Dimensionsprädiktoren und der visualisierten Detailgenauigkeit
Dimensionsprädiktoren müssen dieselbe Detailgenauigkeit wie die Visualisierung haben oder höher. Das heißt, wenn Sie Daten nach State visualisieren, können Sie State, Region oder Country als Prädiktoren verwenden. Die Verwendung von City als Prädiktor verursacht hingegen einen Fehler. Da mehrere Städte innerhalb eines Bundesstaates vorhanden sind, wird dieser Prädiktor für alle Markierungen in * aufgelöst, und er gibt keine aussagekräftigen Informationen zurück. Daher wird er von Tableau ignoriert.
Jeder Dimensionsprädiktor muss in eine ATTR-Funktion eingeschlossen werden, z. B.:
MODEL_PERCENTILE(SUM([Sales]), ATTR([State]), ATTR([Category])
Mehrere Prädiktoren stehen miteinander in Konflikt
Jeder Prädiktor, der innerhalb einer bestimmten Vorhersagemodellierungsfunktion verwendet wird, muss unabhängige Informationen für die Berechnung bereitstellen. Wenn zwei Prädiktoren ausgewählt sind, die genau äquivalent oder skalierte Versionen oder Umkehrungen voneinander sind, gibt die Vorhersagemodellierungsfunktion bei ihrer Visualisierung einen Fehler zurück.
Ein Datensatz zur Nachverfolgung von Wetterbedingungen im Laufe der Zeit kann beispielsweise zwei Felder enthalten: IsRain und IsClear. Diese beiden Felder sind Umkehrungen voneinander – das heißt, IsClear = True, wenn IsRain = False und umgekehrt. Wenn Sie sowohl IsClear als auch IsRain als Prädiktoren für eine einzelne Vorhersagemodellierungsfunktion einschließen, wird ein Fehler zurückgegeben.
Dies gilt sowohl für Kennzahlen als auch für Dimensionen als Prädiktoren.
In beiden Fällen kann der Fehler behoben werden, indem Sie Ihre Prädiktoren ändern und dabei stark korrelierte Prädiktoren entfernen. Weitere Informationen finden Sie unter Auswählen von Prädiktoren.
Es sind nicht genügend Daten vorhanden, um ein Modell zu erstellen
Es müssen mindestens drei Markierungen innerhalb einer Partition vorhanden sein, damit die Vorhersagemodellierungsfunktionen ein Modell erstellen und Vorhersagen generieren können. Wenn der durch die angezeigten Daten und die Dimension "Berechnen per" definierte Datensatz zwei oder weniger Markierungen enthält, gibt die Vorhersagemodellierungsfunktion NULL-Ergebnisse zurück.
Um dieses Problem zu beheben, überarbeiten Sie die Detailgenauigkeit, die Datenfilterparameter oder die Dimension "Berechnen per", sodass jede Partition mehr als zwei Markierungen enthält.
Anhand der bereitgestellten Daten konnte kein erfolgreiches Modell erstellt werden
Dieser Fehler wird angezeigt, wenn ein Konflikt zwischen den ausgewählten Prädiktoren, der visualisierten Detailgenauigkeit und/oder der ausgewählten Dimension "Berechnen per" besteht, sodass es unmöglich ist, die Prädiktoren zum Erstellen eines rationalen Modells zu verwenden.
Sehen wir uns beispielsweise die folgende MODEL_QUANTILE-Berechnung an:
MODEL_QUANTILE(0.5, MEDIAN([Profit]), ATTR(MONTH([Order Date])))
Wenn Sie diese Berechnung auf eine Visualisierung anwenden, bei der jede Markierung einen Wert vom Typ State repräsentiert, wird der folgende Fehler zurückgegeben:
Da Order Date nicht zum Visualisieren oder Segmentieren der Daten verwendet wird, kann die Vorhersagemodellierungsfunktion nicht den zum Erstellen eines Modells angegebenen Prädiktor verwenden.
So beheben Sie dieses Problem:
- Aktualisieren Sie Ihre Visualisierung, sodass der Prädiktor als Dimension eingeschlossen wird.
- Aktualisieren Sie Ihre Funktion, um den unbrauchbaren Prädiktor zu entfernen.
Es ist erwähnenswert, dass dieser Fehler eine Nichtübereinstimmung zwischen der Visualisierung und den spezifischen Prädiktoren der Tabellenberechnung widerspiegelt. Dieselbe Berechnung würde problemlos funktionieren, wenn sie auf eine Visualisierung angewendet wird, die Order Date als Dimension enthält.
Die gaußsche Prozessregression erfordert genau einen geordneten Dimensionsprädiktor
Für die Verwendung der gaußschen Prozessregression müssen Sie genau eine geordnete Dimension als Prädiktor einschließen. Sie können zusätzliche ungeordnete Dimensionen als Prädiktoren einschließen. In der gaußschen Prozessregression können Kennzahlen nicht als Prädiktoren verwendet werden.
Wenn dieser Fehler auftritt, fügen Sie der Tabellenberechnung einen geordneten Dimensionsprädiktor hinzu, entfernen Sie den überschüssigen geordneten Prädiktor oder geben Sie an, dass eine der geordneten Dimensionen als ungeordnete Dimension behandelt werden soll.
Da die gaußsche Prozessregression am besten für Zeitreihendaten verwendet wird, wird dies in der Regel in Form eines zeitbasierten Prädiktors wie ATTR(DATETRUNC('month',[Order Date])) erfolgen. Im DATETRUNC-Ausdruck kann ein date_part verwendet werden, aber der date_part muss dieselbe oder eine höhere Detailebene wie die Visualisierung haben. Das heißt, wenn bei der Visualisierung WEEK([Order Date]) als Aggregationsebene verwendet, muss der date_part 'week', 'month', 'quarter' usw. lauten. Er kann nicht 'dayofyear', 'day', 'weekday', 'hour' usw. lauten.
Hinweis: Da ATTR(MONTH([Date])) Zeichenfolgenwerte zurückgibt, funktioniert dies nicht als geordneter dimensionaler Prädiktor, es sei denn, er wird manuell angegeben. Dazu fügen Sie unmittelbar vor dem Prädiktor "ordered" ein, wie im Folgenden dargestellt:
MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
"ordered",ATTR(MONTH([Order Date]))
)
Wenn Sie mehrere Zeitdimensionen in Ihre Prädiktoren einbeziehen möchten, müssen Sie angeben, welche Dimensionen als ungeordnete Dimensionen verwendet werden sollen. Dazu können Sie unmittelbar vor der betreffenden Dimension "unordered" einfügen, wie im Folgenden:
MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
ATTR(DATETRUNC('month',[Order Date]))
"unordered",ATTR(DATETRUNC('year',[Order Date]))
)
Wenn Sie versuchen, die obige Berechnung zu verwenden, ohne "unordered" vor ATTR(DATETRUNC('year',[Order Date]) anzugeben, wird ein Fehler zurückgegeben.
Darüber hinaus muss die Adressierungsrichtung (oder "Berechnen per") für die gaußsche Prozessregression auf dasselbe Feld wie der geordnete Dimensionsprädiktor festgelegt werden.
Für alle Modelle kann nur eine Adressierungsrichtung (oder "Berechnen per") ausgewählt werden.
Die gaußsche Prozessregression unterstützt nur Dimensionen als Prädiktoren
In gaußschen Prozessberechnungen können Sie keine Kennzahlen als Prädiktoren verwenden. Entfernen Sie den Kennzahlenprädiktor.
Diese Einschränkung gilt nur für prädiktive Modellierungsfunktionen, die die gaußsche Prozessregression angeben. Die lineare Regression (bzw. OLS, Standardeinstellung) und die regularisierte lineare Regressionsfunktionen unterstützen beide Kennzahlen als Prädiktoren.
Es gibt keine Schulungsdaten für ein oder mehrere Vorhersageziele
Die gaußsche Prozessregression erfordert für jede Datenpartition mindestens n Datenpunkte, um ein Vorhersagemodell zu erstellen und Vorhersagen zurückzugeben. Wenn dieser Fehler auftritt, überarbeiten Sie Ihre Vorhersagen.
Es gibt mehr als 5.000 Markierungen
Gaußsche Prozessregressionen werden nur bei Visualisierungen mit weniger als 5.000 Markierungen unterstützt. Um dieses Problem zu beheben, aktualisieren Sie Ihre Detailgenauigkeit, um die Anzahl Markierungen zu verringern, oder wählen Sie ein anderes statistisches Modell aus.