Modellazione predittiva con indicatori generati

Se usi Tableau da qualche tempo, potresti aver sentito l’espressione "densificazione dei dati". Si riferisce a un processo in cui indicatori vengono generati da Tableau e aggiunti alla vista, anche se tali indicatori non sono supportati da record nell’origine dati sottostante. Questa operazione può essere eseguita per estendere un asse delle date o, se si lavora con le funzioni di modellazione predittiva, per visualizzare previsioni.

Guarda un video: per una discussione approfondita sulla densificazione dei dati, dai un’occhiata a questa presentazione di TC19: You Did What to Your Data? A Deep Dive into Imputing and Densifying Data.

Per ulteriori informazioni, consulta questo post di blog sulla densificazione dei dati di Data Plus Science.

Calcolare le previsioni dei valori mancanti

È ad esempio possibile aggiungere previsioni per date future. Per impostazione predefinita, i valori mancanti in Tableau non vengono visualizzati, ma è possibile generare questi indicatori come segue:

  1. Fai clic con il pulsante destro del mouse (Control-clic su Mac) sull’intestazione della data o del contenitore.

  2. Seleziona Mostra valori mancanti.

    menu di scelta rapida della pillola con l’opzione Mostra valori mancanti selezionata

  3. Tuttavia, questo non è sufficiente per creare previsioni relative agli indicatori generati. Se tenti di eseguire un calcolo su di essi (che si tratti di un calcolo di previsione o meno), Tableau restituisce valori Null. Questo è un comportamento previsto, poiché tali indicatori sono basati su valori mancanti che non esistono.

    Per creare previsioni dei valori mancanti, apri il menu Analisi nella parte superiore, quindi seleziona Deduci le proprietà dai valori mancanti.

    Menu Analisi con l’opzione Deduci le proprietà dai valori mancanti selezionata

    Nota: per impostazione predefinita, l’opzione Deduci le proprietà dai valori mancanti è disattivata, anche quando l’opzione Mostra valori mancanti è attivata. È possibile applicare questa impostazione a qualsiasi campo o asse che può essere espanso utilizzando l’opzione Mostra valori mancanti.

Esempio di previsione degli indicatori generati

Esploriamo ulteriormente questo comportamento. Confronteremo tre diverse illustrazioni che mostrano come le impostazioni Mostra valori mancanti e Deduci le proprietà dai valori mancanti possono influire sulla visualizzazione, a seconda che una o entrambe le opzioni siano attivate o disattivate. Per seguire gli esempi, scarica la seguente cartella di lavoro da Tableau Public: Predictions on Missing Values.

Abbiamo incluso le previsioni usando ATTR(DAY([Order Date])) come predittore. Questo non è il miglior predittore per i dati (e produce previsioni inadeguate), ma ai fini del presente articolo è utile per illustrare l’opzione Deduci le proprietà dai valori mancanti.

Ogni visualizzazione include le stesse quattro misure nello spazio Righe, come descritto di seguito:

  • Riga 1: SUM([Profit])
  • Riga 2: RUNNING_SUM(SUM([Profit]))
  • Riga 3: ATTR(DAY([Order Date]))
  • Riga 4: MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

Illustrazione 1

Illustrazione 1

Nell’immagine precedente, entrambe le opzioni Mostra valori mancanti e Deduci le proprietà dai valori mancanti sono disattivate, in base alle impostazioni predefinite di Tableau.

Verrebbe mostrata la stessa visualizzazione se l’opzione Deduci le proprietà dai valori mancanti fosse attivata e Mostra valori mancanti fosse disattivata. Ciò è dovuto al fatto che l’opzione Deduci le proprietà dai valori mancanti dipende dall’attivazione dell’opzione Mostra valori mancanti.

Illustrazione 2

Illustrazione 2

Nell’immagine precedente, l’opzione Mostra valori mancanti è attivata, mentre Deduci le proprietà dai valori mancanti è disattivata. Per impostazione predefinita, l’opzione Deduci le proprietà dai valori mancanti è disattivata, anche quando l’opzione Mostra valori mancanti è attivata.

Puoi notare che in questa situazione non calcoliamo un valore per ATTR su DAY([Order Date]) per i valori mancanti (riga 3). Generiamo una previsione per le date densificate, ma è identica per tutte le date mancanti, poiché non siamo in grado di dedurre il valore effettivo di ATTR(DAY([Order Date])), come mostrato nella riga 3. Effettivamente, tali indicatori vengono calcolati come se DAY([Order Date]) fosse Null.

Illustrazione 3

Illustrazione 3

In questa immagine, entrambe le opzioni Mostra valori mancanti e Deduci le proprietà dai valori mancanti sono attivate, in modo da osservare l’impostazione Deduci le proprietà dai valori mancanti in azione.

Come puoi vedere, dal momento che siamo in grado di dedurre ATTR(DAY([Order Date])) (riga 3), possiamo usarlo per le previsioni nella riga 4. Il risultato è una curva uniforme di previsioni.

Grazie per il tuo feedback.Il tuo feedback è stato inviato. Grazie!