Come funzionano le previsioni in Tableau

Le previsioni in Tableau utilizzano una tecnica nota come livellamento esponenziale. Gli algoritmi di previsione cercano di trovare un modello regolare nelle misurazioni che può essere mantenuto in futuro. Se sei interessato alla modellazione predittiva, anch’essa disponibile in Tableau, consulta Funzionamento delle funzioni di modellazione predittiva in Tableau.

In genere si aggiunge una previsione a una vista contenente un campo data e almeno una misurazione. In assenza di una data, tuttavia, Tableau può creare una previsione per una vista contenente una dimensione con valori interi oltre ad almeno una misurazione.

Per informazioni dettagliate sulla creazione di una previsione, consulta Crea una previsione. Per informazioni dettagliate sulla previsione utilizzando una dimensione di numero intero, consulta Previsioni in assenza di data nella vista.

Panoramica

Tutti gli algoritmi di previsione sono modelli semplici di un processo di generazione dati (DGP) in un contesto reale. Per ottenere una previsione di alta qualità, un modello semplice di DGP deve corrispondere piuttosto bene al modello descritto. Le metriche di qualità misurano il grado di corrispondenza tra il modello il DGP. Se la qualità è bassa, la precisione misurata mediante le bande di attendibilità non è importante perché misurano la precisione di una stima imprecisa.

Tableau seleziona automaticamente il migliore dei modelli, fino ad un massimo di otto, vale a dire quello che genera la previsione di maggiore qualità. I parametri di livellamento di ciascun modello vengono ottimizzati prima che Tableau ne valuti la qualità di previsione. Il metodo di ottimizzazione è globale. Pertanto, non è impossibile scegliere dei parametri di livellamento ottimali localmente che non sono i migliori a livello globale. Tuttavia, i parametri dei valori iniziali sono selezionati in base alle procedure ottimali ma non sono ottimizzati ulteriormente. È pertanto possibile che i parametri dei valori iniziali non siano ottimali. Gli otto modelli disponibili in Tableau sono tra quelli descritti al seguente indirizzo nel sito Web OTexts: A taxonomy of exponential smoothing methods.(Il collegamento viene aperto in una nuova finestra)

Quando la visualizzazione non contiene dati sufficienti, Tableau tenta automaticamente di effettuare una previsione a una granularità temporale più precisa e quindi aggrega la previsione alla granularità della visualizzazione. Tableau fornisce bande di previsione che possono essere simulate o calcolate a partire da un’equazione del modulo chiusa. Tutti i modelli con un componente moltiplicativo o con previsioni aggregate dispongono di bande simulate, mentre tutti gli altri modelli usano le equazioni del modulo chiuse.

Livellamento esponenziale e tendenza

I modelli di livellamento esponenziale prevedono in maniera iterativa i valori futuri di una serie temporale normale di valori a partire da medie ponderate di vecchi valori passati della serie. Il modello più semplice, Livellamento esponenziale semplice, calcola il livello successivo o il valore livellato a partire da una media ponderata tra l’ultimo valore effettivo e l’ultimo valore di livello. Il metodo è esponenziale perché il valore di ogni livello viene influenzato da ogni valore effettivo precedente a un livello decrescente in maniera esponenziale. I valori più recenti hanno un peso maggiore.

I modelli di livellamento esponenziale con componenti di tendenza o stagionali sono efficaci quando la misurazione da prevedere mostra una tendenza o una stagionalità nel periodo di tempo della previsione. Tendenza è una tendenza dei dati ad aumentare o diminuire nel tempo. Stagionalità è una variazione ripetuta e prevedibile di un valore, ad esempio una fluttuazione annuale nella temperatura relativa alla stagione.

In generale, maggiore è la quantità di punti dati nella serie temporale, migliore sarà la previsione risultante. È particolarmente importante disporre di dati sufficienti se desideri creare un modello di stagionalità, perché il modello è più complesso e richiede maggiori verifiche sotto forma di dati per raggiungere un livello di precisione ragionevole. D’altra parte, se prevedi di utilizzare dati generati da due o più DGP diversi, otterrai una previsione di minore qualità, in quanto un modello può corrispondere solo a uno.

Stagionalità

Tableau testa un ciclo stagionale con la lunghezza più tipica dell’aggregazione temporale della serie temporale per cui è stimata la previsione. Quindi, se procedi con un’aggregazione per mesi, Tableau cerca un ciclo di 12 mesi; se aggreghi per trimestri, Tableau cerca un ciclo di quattro trimestri; se aggreghi per giorni, Tableau cerca una stagionalità settimanale. Di conseguenza, se la serie temporale presenta un ciclo di sei mesi, Tableau probabilmente troverà un modello di 12 mesi contenente due sotto-modelli simili. Tuttavia, se la serie temporale presenta un ciclo di sette mesi, Tableau probabilmente non troverà alcun ciclo. Fortunatamente i cicli di sette mesi sono rari.

Tableau può utilizzare uno dei due metodi per derivare la lunghezza della stagione. Il metodo temporale originale utilizza la lunghezza naturale della stagione della granularità temporale (TG) della vista. La granularità temporale indica l’unità temporale più precisa espressa dalla vista. Ad esempio, se la vista contiene una data verde, continua e troncata per mese, o parti di data annuali e mensili, blu e distinte, la granularità temporale della vista è il mese. Il nuovo metodo non temporale, introdotto con Tableau 9.3, utilizza la regressione periodica per controllare le lunghezze della stagione comprese tra 2 e 60 per le lunghezze candidate.

Tableau seleziona automaticamente il metodo più appropriato per una determinata vista. Quando Tableau utilizza una data per ordinare le misurazioni in una vista, se la granularità temporale è trimestrale, mensile, settimanale, giornaliera o oraria, le lunghezze della stagione sono quasi sicuramente 4, 12, 13, 7 o 24, rispettivamente. Pertanto, solo la lunghezza naturale della granularità temporale (TG) viene utilizzata per costruire i cinque modelli stagionali di livellamento esponenziale supportati da Tableau. I criteri d’informazione di Akaike (AIC) dei cinque modelli stagionali e i tre modelli non stagionali vengono confrontati e il minore viene restituito (per ulteriori spiegazioni della metrica AIC, consulta Descrizioni delle previsioni).

Quando Tableau utilizza una dimensione di numero intero per la previsione, viene utilizzato il secondo metodo. In questo caso non vi è alcuna granularità temporale (TG), pertanto è necessario derivare le lunghezze della stagione potenziale dai dati.

Il secondo metodo viene inoltre utilizzato quando la granularità temporale è annuale. Le serie annuali generalmente non presentano stagionalità, ma se lo fanno, è necessario derivarla dai dati.

Il secondo metodo viene inoltre utilizzato per le viste con una granularità temporale di minuto o secondo. Se tali serie presentano stagionalità, le lunghezze della stagione sono probabilmente 60. Tuttavia, quando si misura un normale processo del mondo reale, il processo può avere una ripetizione regolare che non corrisponde all’orologio. Di conseguenza, per i minuti e i secondi, Tableau cerca inoltre una lunghezza diversa da 60 nei dati. Ciò non significa che Tableau può modellare due diverse lunghezze stagionali contemporaneamente. Al contrario, vengono stimati dieci modelli stagionali, cinque con una lunghezza stagionale di 60 e altri cinque con una lunghezza stagionale derivata dai dati. Che sia uno dei dieci modelli stagionali o dei tre modelli non stagionali con l’AIC più basso, questo modello viene utilizzato per calcolare la previsione.

Per le serie ordinate in base all’anno, al minuto o al secondo viene testata una singola lunghezza stagionale dai dati se il modello è abbastanza chiaro. Per le serie ordinate in numeri interi si stimano fino a un massimo di nove lunghezze stagionali potenziali un po' meno chiare per tutti e cinque i modelli stagionali e viene restituito il modello con l’AIC più basso. Se non sono previsti candidati di lunghezza stagionale, si stimeranno solo i modelli non stagionali.

Poiché tutte le selezioni sono automatiche, quando Tableau deriva le lunghezze stagionali potenziali dai dati, il tipo di modello predefinito "Automatico" nel menu Tipo di modello della finestra di dialogo Opzioni di previsione non cambia. La selezione di "Automatico senza stagionalità" migliora le prestazioni eliminando tutte le ricerche di lunghezza stagionale e le stime dei modelli stagionali.

L’euristica che Tableau utilizza per determinare quando utilizzare lunghezze stagionali derivate dai dati dipende dalla distribuzione di errori per la regressione periodica di ogni lunghezza stagionale candidata. Poiché l’insieme di lunghezze stagionali candidate per regressione periodiche produce in genere una o due lunghezze chiaramente vincenti, se la stagionalità è effettivamente presente nei dati, la restituzione di un singolo candidato indica una probabile stagionalità. In questo caso, Tableau stima i modelli stagionali contenenti questo candidato per la granularità di anno, minuto e secondo. La restituzione di meno di dieci candidati massimo indica una possibile stagionalità. In questo caso, Tableau stima i modelli stagionali contenenti tutti i candidati restituiti per le viste ordinate per numeri interi. La restituzione del numero massimo di candidati indica che gli errori per la maggior parte delle lunghezze sono simili. Di conseguenza, l’esistenza di stagionalità è improbabile. In questo caso, Tableau stima solo i modelli non stagionali per una serie ordinata per numeri interi o per anno, e solo i modelli stagionali con una lunghezza naturale della stagione per le altre viste ordinate in modo temporale.

Per il tipo di modello "Automatico" nelle viste ordinate per numero intero, anno, minuto e secondo, le lunghezze stagionali candidate sono sempre derivate dai dati indipendentemente dal fatto che siano utilizzate o meno. Poiché la stima del modello richiedere più tempo rispetto alla regressione periodica, l’impatto sulle prestazioni può essere moderato.

Tipi di modello

Nella finestra di dialogo Opzioni di previsione, puoi scegliere il tipo di modello che gli utenti di Tableau utilizzeranno per la previsione. L’impostazione Automatico è in genere ottimale per la maggior parte delle viste. Selezionando Personalizza , potrai specificare le caratteristiche di tendenza e stagione in modo indipendente, scegliendo Nessuno, Aggiuntivo, o Moltiplicativo:

Un modello aggiuntivo è un modello nel quale i contributi dei componenti del modello si sommano, mentre nel modello moltiplicativo almeno alcuni dei contributi dei componenti si moltiplicano. I modelli moltiplicativi possono migliorare in modo significativo la qualità di previsione per i dati in cui la tendenza o la stagionalità è influenzata dal livello (magnitudo) dei dati:

Tieni presente che non è necessario creare un modello personalizzato per generare una previsione che sia moltiplicativa: l’impostazione Automatico può determinare se una previsione moltiplicativa è appropriata per i dati. Non è tuttavia possibile calcolare un modello moltiplicativo quando la misurazione da prevedere ha uno o più valori inferiori o uguali a zero.

Previsione con dati temporali

Quando si esegue la previsione con una data, può esserci una sola data di base nella vista. Le parti di data sono supportate, ma tutte le parti devono fare riferimento allo stesso campo sottostante. Le date possono essere su Righe, Colonne, o Indicatori (con l’eccezione della destinazione Informazioni).

Tableau supporta tre tipi di date, due delle quali possono essere utilizzate per la previsione:

  • Le date troncate fanno riferimento a un punto specifico nella storia con una granularità temporale specifica, ad esempio febbraio 2017. Sono in genere continue, con uno sfondo verde nella vista. Le date troncate sono valide per la previsione.

  • Le parti di data fanno riferimento a un particolare membro di una misurazione temporale, ad esempio febbraio. Ogni parte di data è rappresentata da un campo diverso, in genere distinto (con uno sfondo blu). La previsione richiede almeno una parte di data Anno. In particolare, può utilizzare uno degli insiemi di parti di data seguenti per la previsione:

    • Anno

    • Anno + trimestre

    • Anno + mese

    • Anno + trimestre + mese

    • Anno + settimana

    • Personalizzato: Mese/Anno, Mese/Giorno/Anno

    Le altre parti di data, come Trimestre o Trimestre + mese, non sono valide per la previsione. Per ulteriori dettagli su diversi tipi di date, consulta Convertire i campi tra distinto e continuo.

  • Le date esatte fanno riferimento a un punto specifico nella storia con una granularità temporale massima, ad esempio 1 febbraio 2012 alle 14:23:45.0. Le date esatte non sono valide per la previsione.

È inoltre possibile effettuare una previsione senza date. Consulta Previsioni in assenza di data nella vista.

Granularità e tagli

Quando crei una previsione, selezioni una dimensione data che specifica un’unità di tempo in corrispondenza della quale si misurano i valori di data. Le date di Tableau supportano un intervallo di tali unità di tempo, tra cui Anno, Trimestre, Mese e Giorno. L’unità scelta per il valore di data è nota come granularità della data.

I dati nella misurazione in genere non coincidono con precisione con l’unità di granularità. Puoi impostare il valore di data su trimestri, ma i dati effettivi possono terminare a metà trimestre, ad esempio, alla fine di novembre. Ciò può causare un problema perché il valore per questo trimestre parziale è gestito dal modello di previsione come un trimestre completo, che in genere ha un valore inferiore rispetto a quello di un trimestre completo. Se il modello di previsione è autorizzato a prendere in considerazione questi dati, la previsione risultante non sarà accurata. La soluzione consiste nel tagliare i dati, in modo da ignorare i periodi finali che potrebbero falsare la previsione. Utilizza l’opzione Ignora ultimo nella finestra di dialogo Opzioni di previsione per rimuovere o tagliare i periodi parziali. Per impostazione predefinita, si tratta di tagliare un periodo.

Ottenere più dati

Tableau richiede almeno cinque punti dati nelle serie temporali per stimare una tendenza e punti dati sufficienti per almeno due stagioni o una stagione più cinque periodi per stimare una stagionalità. Ad esempio, sono necessari almeno nove punti dati per stimare un modello con un ciclo stagionale di quattro trimestri (4 + 5) e almeno 24 per stimare un modello con un ciclo stagionale di 12 mesi (2 x 12).

Se attivi la previsione per una vista che non dispone di un numero sufficiente di punti dati per generare una buona previsione, Tableau può talvolta recuperare i punti dati in modo da produrre una previsione valida, eseguendo una query per un livello di granularità più preciso:

  • Per impostazione predefinita, se la vista contiene meno di nove anni di dati Tableau esegue una query nell’origine dati per recuperare i dati trimestrali, stimare una previsione trimestrale e aggregare a una previsione annuale da visualizzare nella vista. Se il numero di punti dati non è ancora sufficiente, Tableau stima una previsione mensile e restituisce la previsione annuale aggregata nella vista.

  • Per impostazione predefinita, se la vista contiene meno di nove trimestri di dati, Tableau stima una previsione mensile e restituisce i risultati di una previsione trimestrale nella vista.

  • Per impostazione predefinita, se la vista contiene meno di nove settimane di dati, Tableau stima una previsione giornaliera e restituisce i risultati di una previsione settimanale nella vista.

  • Per impostazione predefinita, se la vista contiene meno di nove giorni di dati, Tableau stima una previsione oraria e restituisce i risultati di una previsione giornaliera aggregata nella vista.

  • Per impostazione predefinita, se la vista contiene meno di nove ore di dati, Tableau stima una previsione per minuti e restituisce i risultati di una previsione oraria aggregata nella vista.

  • Per impostazione predefinita, se la vista contiene meno di nove minuti di dati, Tableau stima una previsione per secondi e restituisce i risultati di una previsione per minuti aggregati nella vista.

Queste regolazioni si verificano dietro le quinte e non richiedono alcuna configurazione. Tableau non modifica l’aspetto della visualizzazione e non modifica effettivamente il valore della data. Tuttavia, il riepilogo del periodo di tempo della previsione nelle finestre di dialogo Descrivi previsione e Opzioni di previsione rifletterà la granularità effettiva utilizzata.

Tableau può ottenere più dati soltanto quando l’aggregazione per la misurazione da prevedere è SUM o COUNT. Per informazioni sui tipi di aggregazione disponibili e su come modificare il tipo di aggregazione, consulta Aggregazione di dati in Tableau.

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!