Risolvere gli errori nelle funzioni di modellazione predittiva

Durante l’utilizzo delle funzioni di modellazione predittiva in Tableau, potrebbero verificarsi errori quando si tenta di aggiungere i calcoli a una visualizzazione. Spesso, ciò è dovuto a una combinazione di predittori ed elementi visualizzati che determina un calcolo matematicamente non valido.

In genere, la prima operazione da eseguire è controllare la dimensione Calcola utilizzando. Verifica quindi che non vi sia una mancata corrispondenza tra il livello di dettaglio specificato nei predittori e il livello di dettaglio nella vista. Verifica inoltre che i predittori forniscano dati pertinenti al modello, data la visualizzazione corrente.

In questo articolo vengono descritti in dettaglio diversi problemi comuni e i modi in cui è possibile risolverli.

Gli errori relativi alle funzioni di modellazione predittiva sono in genere causati da uno o più dei seguenti problemi, a seconda del modello in uso.

Errori generali

Errori relativi alla regressione con processo gaussiano

Dimensione Calcola utilizzando non valida

Quando si visualizza una funzione di modellazione predittiva, è necessario specificare una dimensione Calcola utilizzando. È consigliabile selezionare una dimensione specifica, ad esempio Regione o Categoria, anziché una dimensione direzionale, ad esempio Tabella (orizzontale quindi verticale) o Riquadro (orizzontale).

Poiché in una dimensione di partizionamento o in una dashboard possono essere incluse più funzioni di modellazione predittiva, la selezione di una dimensione di partizionamento specifica consente di creare modelli utilizzando lo stesso insieme di dati sottostante per ogni singola funzione. In altre parole, viene eseguito un confronto dei risultati da modelli simili.

Per maggiori informazioni su indirizzamento e partizionamento, consulta Trasformare i valori con i calcoli tabella.

Quando si lavora con le funzioni di modellazione predittiva, è fondamentale garantire la coerenza tra le diverse istanze, sia nelle diverse iterazioni del modello (ad esempio, quando si selezionano predittori diversi) che nelle diverse visualizzazioni. L’utilizzo delle dimensioni Calcola utilizzando direzionali apre la possibilità che una banale modifica nei dati visualizzati influisca in modo significativo sui dati utilizzati per creare il modello, influenzandone la validità e la coerenza tra diverse visualizzazioni.

Possono essere visualizzati valori Null se non è stata specificata alcuna dimensione Calcola utilizzando o se è stata selezionata una dimensione Calcola utilizzando non valida.

Le dimensioni Calcola utilizzando non valide includono:

  • Cella: questa dimensione comporterà sempre l’utilizzo di un singolo punto dati per la creazione di un modello e non avrà esito positivo.
  • Una dimensione nidificata di livello superiore (ad esempio, se Regione e Stato sono entrambi visualizzati su un asse in cui gli indicatori vengono generati per Stato ma raggruppati per Regione). Se è selezionata Regione come dimensione di partizionamento, verranno restituiti valori Null, poiché non sono presenti indicatori formalizzati per Regione in questa visualizzazione.

visualizzazione in cui le dimensioni Calcola utilizzando sono Stato e Categoria

Nella visualizzazione precedente, le dimensioni Calcola utilizzando valide sono Stato e Categoria. Il partizionamento dei dati per Stato o Categoria produce più indicatori validi che possono essere utilizzati per creare un modello.

Regione, sebbene sia elencata come opzione Calcola utilizzando, non genera alcun indicatore al livello di dettaglio di questa vista e non può essere utilizzata per partizionare i dati.

Per maggiori informazioni, consulta Calcola utilizzando e partizionamento dei dati nella modellazione predittiva.

Predittori di dimensioni in conflitto con il livello di dettaglio visualizzato

I predittori di dimensioni devono essere allo stesso livello di dettaglio della visualizzazione o a un livello superiore. In altre parole, se si stanno visualizzando i dati per Stato, è possibile utilizzare Stato, Regione o Paese come predittori, ma l’utilizzo di Città come predittore genererà un errore. Poiché esistono più città all’interno di uno stato, questo predittore verrà risolto in * per tutti gli indicatori e non restituirà informazioni significative. Di conseguenza, Tableau lo ignorerà.

Ogni predittore dimensionale deve essere racchiuso all’interno di una funzione ATTR, ad esempio:

MODEL_PERCENTILE(SUM([Sales]), ATTR([State]), ATTR([Category])

Più predittori in conflitto tra loro

Ogni predittore utilizzato in una determinata funzione di modellazione predittiva deve fornire informazioni indipendenti al calcolo. Se vengono selezionati due predittori che sono esattamente equivalenti, versioni ridimensionate o inversi l’uno dell’altro, la funzione di modellazione predittiva restituirà un errore quando viene visualizzata.

Ad esempio, un insieme di dati che tiene traccia delle condizioni meteorologiche nel tempo potrebbe avere due campi: IsRain e IsClear. Questi due campi sono inversi l’uno dell’altro, ovvero IsClear = True quando IsRain = False e viceversa. L’inclusione di IsClear e IsRain come predittori in una singola funzione di modellazione predittiva restituirà un errore.

Questo vale sia per l’utilizzo di misure che di dimensioni come predittori.

In entrambi i casi, l’errore può essere risolto modificando i predittori in modo da rimuovere i predittori altamente correlati. Per maggiori informazioni, consulta Scelta dei predittori.

Dati insufficienti per creare un modello

Devono essere presenti almeno tre indicatori all’interno di una partizione per consentire alle funzioni di modellazione predittiva di creare un modello e generare previsioni. Se nell’insieme di dati definito dai dati visualizzati e dalla dimensione Calcola utilizzando sono presenti due indicatori o meno, la funzione di modellazione predittiva restituirà risultati Null.

Per risolvere questo problema, modifica il livello di dettaglio, i parametri di filtro dei dati o la dimensione Calcola utilizzando in modo che ogni partizione abbia più di due indicatori.

Impossibile creare un modello valido a partire dai dati forniti

Questo errore si verifica se è presente un conflitto tra i predittori selezionati, il livello di dettaglio visualizzato e/o la dimensione Calcola utilizzando selezionata, tale da rendere impossibile utilizzare i predittori per creare un modello razionale.

Ad esempio, esaminiamo questo calcolo MODEL_QUANTILE:

MODEL_QUANTILE(0.5, MEDIAN([Profit]), ATTR(MONTH([Order Date])))

L’applicazione di questo calcolo a una visualizzazione in cui ogni indicatore rappresenta un valore di State restituirà l’errore seguente:

messaggio di errore

Poiché Order Date non viene utilizzato per visualizzare o segmentare i dati, la funzione di modellazione predittiva non può usare il predittore specificato per creare un modello.

Per risolvere il problema:

  • Aggiorna la visualizzazione in modo da includere il predittore come dimensione.
  • Aggiorna la funzione in modo da rimuovere il predittore non valido.

Vale la pena notare che questo errore riflette una mancata corrispondenza tra la visualizzazione e i predittori specifici del calcolo tabella. Questo stesso calcolo funzionerebbe senza problemi se venisse applicato a una visualizzazione che include Order Date come dimensione.

La regressione con processo gaussiano richiede esattamente un predittore di dimensione ordinato

Per utilizzare la regressione con processo gaussiano, è necessario includere esattamente una dimensione ordinata come predittore. È possibile includere ulteriori dimensioni non ordinate come predittori. Le misure non possono essere utilizzate come predittori con la regressione con processo gaussiano.

Se si verifica questo errore, aggiungi un predittore di dimensione ordinato al calcolo tabella, rimuovi il predittore di dimensione ordinato in eccesso o specifica che una delle dimensioni ordinate deve essere trattata come una dimensione non ordinata.

Poiché la regressione con processo gaussiano è particolarmente indicata nei dati delle serie temporali, in genere viene utilizzato un predittore basato sul tempo come ATTR(DATETRUNC('month',[Data ordine])). Qualsiasi valore date_part può essere utilizzato nell’espressione DATETRUNC, ma date_part deve essere allo stesso livello di dettaglio della visualizzazione o a un livello superiore. In altre parole, se la visualizzazione utilizza WEEK([Data ordine]) come livello di aggregazione, date_part deve essere "week", "month", "quarter" e così via. Non può essere "dayofyear", "day", "weekday", "hour" e così via.

Poiché ATTR(MONTH([Data])) restituisce valori stringa, non funzionerà come predittore dimensionale ordinato, a meno che non venga specificato manualmente. Ciò è possibile includendo "ordered" immediatamente prima del predittore, come indicato di seguito:

MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
"ordered",ATTR(MONTH([Order Date]))
)

Se desideri includere più dimensioni temporali nei predittori, devi specificare quelle che vuoi utilizzare come dimensioni non ordinate. Ciò è possibile includendo "unordered" direttamente prima della dimensione, come indicato di seguito:

MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
ATTR(DATETRUNC('month',[Order Date]))
"unordered",ATTR(DATETRUNC('year',[Order Date]))
)

Il tentativo di utilizzare il calcolo precedente senza specificare "unordered" davanti a ATTR(DATETRUNC('year',[Data ordine]) restituirà un errore.

Inoltre, la direzione di indirizzamento (o "Calcola utilizzando") per la regressione con processo gaussiano deve essere impostata sullo stesso campo del predittore di dimensione ordinato.

È possibile selezionare una sola direzione di indirizzamento (o "Calcola utilizzando") per tutti i modelli.

La regressione con processo gaussiano supporta solo le dimensioni come predittori

Non è possibile utilizzare alcuna misura come predittore nei calcoli con processo gaussiano. Rimuovi il predittore di misura.

Questa limitazione si applica solo alle funzioni di modellazione predittiva che specificano la regressione con processo gaussiano. Le funzioni di regressione lineare (o OLS, l’impostazione predefinita) e di regressione lineare regolarizzata supportano le misure come predittori.

Non sono presenti dati di training per una o più destinazioni di previsione

La regressione con processo gaussiano richiede che ogni partizione di dati abbia almeno n punti dati per creare un modello predittivo e restituire previsioni. Se si verifica questo errore, modifica le previsioni.

Sono presenti più di 5.000 indicatori

Le regressioni con processo gaussiano sono supportate solo nelle visualizzazioni con meno di 5.000 indicatori. Per risolvere il problema, aggiorna il livello di dettaglio per ridurre il numero di indicatori oppure seleziona un modello statistico diverso.

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!