Comprendere i termini di Salesforce e Data Cloud
Mentre Tableau Next e Tableau(Il collegamento viene aperto in una nuova finestra) continuano a creare integrazioni sempre più solide, stiamo aggiungendo la possibilità di eseguire analisi ovunque desideri, indipendentemente da dove risiedono i tuoi dati. Ciò significa che la terminologia e la filosofia rispettivamente di Tableau e di Data Cloud si stanno avvicinando sempre di più. Gli utenti che hanno familiarità con un ecosistema possono trovare l’altro ecosistema confuso o estraneo, ma alla fine si tratta solo di dati.
Questo argomento ha lo scopo di aiutare gli utenti a orientarsi indipendentemente dal sistema a cui sono abituati o in cui si trovano a lavorare.
Termini e concetti essenziali relativi ai dati
Per descrivere i dati sono disponibili molti termini. Nel senso più generico, un insieme di dati è la raccolta di dati con cui stai lavorando.
- Un database è la piattaforma tecnologica che contiene effettivamente i dati, come Amazon Redshift, Firebird, Fogli Google o Oracle.
- I dati vengono spesso archiviati sotto forma di tabella di dati. In un database possono essere presenti più tabelle o viste. In Excel o Fogli Google, ogni scheda del foglio è una tabella. In un file CSV, l’intero file costituisce una tabella.
- Se i dati necessari sono distribuiti in più tabelle, devono essere collegati in un modello di dati. Un modello di dati è la rappresentazione astratta del modo in cui le tabelle sono collegate tra loro.
Dati in Salesforce
In Data Cloud, i dati sono suddivisi in concetti diversi.
| Tipo di dati | Descrizione |
|---|---|
| Flusso di dati(Il collegamento viene aperto in una nuova finestra) | Le informazioni di connessione, come l’origine originale (S3, Amazon, Google BigQuery e così via), nonché i campi introdotti, il campo chiave primaria, la frequenza con cui i dati vengono aggiornati e così via. |
| Oggetto data lake (DLO)(Il collegamento viene aperto in una nuova finestra) | I dati inseriti in Data Cloud o a cui fa riferimento un sistema esterno come Snowflake vengono archiviati in un oggetto data lake (DLO). I dati archiviati in un DLO vengono puliti, trasformati e preparati per il calcolo e l’analisi. Ogni tabella di dati è un DLO a sé stante. |
| Oggetto modello di dati (DMO)(Il collegamento viene aperto in una nuova finestra) | Oggetto Data Cloud che descrive la struttura e lo schema dei dati archiviati in uno o più oggetti data lake. Un oggetto modello di dati (DMO) è una tabella di dati, ma può provenire da uno o più DLO. Il DMO prende i dati dei DLO e li mappa in un formato affidabile. Nel DMO vengono applicati insiemi di regole per la risoluzione identità e altri modelli di formattazione. Esistono DMO standard e personalizzati. Il mapping dei dati(Il collegamento viene aperto in una nuova finestra) da un DLO a un DMO e la natura di modello della maggior parte dei DMO sono alla base del potere armonizzante di Data Cloud. |
| Oggetto approfondimento calcolato (CIO)(Il collegamento viene aperto in una nuova finestra) | Oggetto modello di dati creato dopo l’elaborazione di un approfondimento calcolato. Gli approfondimenti calcolati facilitano la creazione di metriche nello stile di un cubo con misure e dimensioni per i dati di Data Cloud. Puoi connetterti a un CIO esistente in Data Cloud e aggiungerlo come risorsa di dati nella tua area di lavoro. |
| Valori separati da virgole (CSV)(Il collegamento viene aperto in una nuova finestra) | File di testo in cui sono archiviati dati in un formato simile a quello di una tabella. I file CSV vengono in genere utilizzati per spostare i dati tra applicazioni e programmi. Per Tableau Next: un file CSV può essere importato in un’area di lavoro di Tableau Next e i dati possono essere caricati e archiviati in Data Cloud come DLO. |
Digressione sugli oggetti dati Salesforce per il pubblico di Tableau
Il flusso di dati è costituito dalle informazioni di connessione.
Il DLO è il dump non elaborato dei dati del flusso di dati. Ogni DLO è una singola tabella.
In Tableau non esiste un oggetto direttamente corrispondente a un DMO. Un DMO può essere mappato a partire da più DLO (analogamente a una “vista” in un database) e ogni DMO è una singola tabella.
Non esiste un oggetto analogo a un CIO in Tableau, dove i calcoli sono campi dell’origine dati come tutti gli altri.
Dati in Tableau
Un’origine dati(Il collegamento viene aperto in una nuova finestra) di Tableau è costituita dalle informazioni di connessione al database, dal modello di dati, dalle informazioni su come accedere ai dati (credenziali di accesso e così via) o su come aggiornarli, dalle informazioni semantiche e anche dai dati stessi. I due elementi principali dell’interfaccia utente per la creazione e la modifica di un’origine dati sono la scheda Origine dati e il riquadro Dati.
Scheda Origine dati: nella scheda Origine dati vengono stabilite le connessioni dati al database o ai file sottostanti e viene creato il modello di dati combinando le tabelle di uno o più database in un’unica origine dati utilizzando relazioni, join e unificazioni(Il collegamento viene aperto in una nuova finestra). Se i dati vengono lasciati nel database originale, viene stabilita una connessione live. È anche possibile inserire una copia dei dati in Tableau come estrazione, che può essere aggiornata se necessario.
Riquadro Dati: nel riquadro Dati vengono acquisite le informazioni semantiche, tra cui i nomi dei campi, gli alias dei membri, le gerarchie, i gruppi, gli insiemi, i calcoli, le aggregazioni e i colori predefiniti e le descrizioni dei campi.
Origine dati: tutte insieme, le modifiche apportate nella scheda Origine dati e nel riquadro Dati formano l’origine dati. Un’origine dati può essere una risorsa pubblicata o un file, oppure può trovarsi all’interno della cartella di lavoro in cui è stata creata.
- Un’origine dati pubblicata (PDS) è una risorsa autonoma in Tableau Cloud o Tableau Server.
- A livello locale, puoi anche trovare versioni di un’origine dati di Tableau basate su file:
.tdsè l’estensione del file per un’origine dati di Tableau contenente le informazioni non relative ai dati (solo informazioni di connessione e semantiche)..tdsxè l’estensione del file per un’origine dati di Tableau compressa contenente le informazioni non relative ai dati e i dati stessi..hyperè l’estensione del file per un’estrazione (in precedenza.tde) contenente una copia dei dati (i dati stessi).
Nota: un’origine dati pubblicata è l’equivalente più vicino in Tableau a un livello semantico o a un modello semantico.
Digressione sui dati di Tableau per il pubblico di Salesforce
Tableau utilizza dati provenienti da un’ampia varietà di database e tecnologie, sia locali che basati su cloud. Poiché i dati non provengono da un cloud Salesforce e dagli oggetti dati specifici di questo, c’è molta flessibilità per quanto riguarda la modellazione e la formattazione dei dati e non esiste un concetto vero e proprio di formato di dati utilizzato come modello.
La standardizzazione e i modelli semantici vengono acquisiti principalmente con origini dati pubblicate (PDS).

Nozioni di base sulla semantica dei dati
- I dati sono i fatti grezzi (numeri, osservazioni e misurazioni).
- Le informazioni sono l’interpretazione di tali dati o la conoscenza che deriva dall’elaborazione e dalla comprensione dei dati.
- La semantica è il ponte tra i dati sottostanti e le informazioni che ne derivano.
Il termine deriva dal concetto linguistico di semantica contrapposto al concetto di sintassi. La sintassi è il modo di esprimere qualcosa, la semantica è il suo significato. Il concetto semantica è il suo significato si estende alla semantica nel contesto dei dati. La semantica include elementi quali il modo in cui le tabelle vengono combinate all’interno del modello di dati, le informazioni relative ai campi, alle colonne di dati e alla loro interazione reciproca, informazioni aggiuntive come l’aggregazione predefinita e i calcoli eseguiti sui dati non elaborati.
Anche se un insieme di dati contiene tutte le informazioni necessarie, se non riesci a capire come ricavarne un significato, è inutile(Il collegamento viene aperto in una nuova finestra). Ha bisogno di semantica per essere utile.
Il caso dell’utilizzo aziendale non può essere separato dai dettagli della semantica. La semantica è la descrizione dei dati o del relativo contesto aziendale. La semantica può essere suddivisa in categorie, ad esempio modellazione dei dati, metadati e descrizioni dei campi, aggregazioni predefinite, gerarchie, gruppi, insiemi e calcoli.
Alcuni esempi:
- Modellazione dei dati
- Il modo in cui le tabelle di dati possono essere collegate tra loro. Le quattro tabelle delle vendite trimestrali devono essere unificate? La tabella dei medici deve essere direttamente correlata alla tabella dei pazienti oppure entrambe devono essere correlate alla tabella degli appuntamenti?
- Metadati dei campi (nome campo, tipo di dati, alias dei membri)
- Nome è il nome di un account o di un contatto?
- Sconto è un campo booleano per l’applicazione o meno di uno sconto, un campo stringa del tipo di sconto o una misura discreta dell’importo dello sconto?
- Descrizioni dei campi
- Ad esempio, un commento che indica che in questo insieme di dati APR sta per Adjusted Pitching Runs, non per Annual Percent Return, e che questo valore è calcolato con la formula
APR = L * IP - R / pf(P)dove L: numero medio di run per inning lanciati nel campionato, IP: inning lanciati, R: run consentiti, pf(P): fattore campo per partita in casa P del giocatore.
- Ad esempio, un commento che indica che in questo insieme di dati APR sta per Adjusted Pitching Runs, non per Annual Percent Return, e che questo valore è calcolato con la formula
- Aggregazioni predefinite
- Gli elenchi devono essere aggregati con COUNT (contando ogni istanza) o con COUNTD (contando solo i valori univoci)?
- L’aggregazione predefinita di una misura deve essere eseguita con SUM o AVG?
- Gerarchie, insiemi, gruppi
- In una raccolta di dipartimenti di un’università, il dipartimento di ingegneria può costituire un istituto a sé stante, mentre i dipartimenti di storia, letteratura, filosofia e scienze politiche insieme possono formare l’istituto di arti liberali.
- Calcoli
- Campi derivati da campi presenti in modo nativo nei dati ma che è necessario modificare o combinare, ad esempio quando vengono definiti come inutilizzati i casi di assistenza aperti da 10 giorni per gli account standard e i casi aperti solo da 2 giorni per gli account Premium.
Semantica in Tableau e Semantica Tableau
Senza un livello semantico riutilizzabile, i modelli di dati, le definizioni semantiche e i campi calcolati potrebbero venire creati una tantum più e più volte, introducendo inefficienze e potenziali errori o disallineamenti.
Semantica in Tableau
La semantica non è una novità per il pubblico di Tableau, fa semplicemente parte dell’origine dati, in particolare nel caso di un’origine dati pubblicata (PDS). L'origine dati pubblicata è il punto in cui si controllano le definizioni semantiche dei dati.
Coerentemente con la filosofia del ciclo dell’analisi visiva(Il collegamento viene aperto in una nuova finestra) di Tableau, storicamente la semantica non è stata isolata astrattamente in un livello distinto. L’ambiente di creazione è il luogo in cui vengono sviluppati insieme il modello di dati (scheda Origine dati) e la semantica (riquadro Dati).
Semantica Tableau
Tableau Semantics(Il collegamento viene aperto in una nuova finestra) adotta l'approccio di separare la semantica in un livello distinto dall'analisi, in modo che i modelli semantici possano essere creati una sola volta e utilizzati in un'ampia gamma di analisi o persino prodotti. Tableau Semantics si integra negli ambienti Data Cloud e Tableau Next come un livello semantico autonomo distinto dai dati o dall'analisi. L’unità del livello semantico è un modello semantico. Il modello semantico contiene sia il modello di dati che le definizioni semantiche per i dati. In Tableau Semantics, il Generatore di modelli semantici è l’interfaccia utente per la creazione di modelli semantici. Questi modelli semantici possono essere generati in Data Cloud o in Tableau Next.
Inoltre, con il connettore Tableau Semantics per Tableau, puoi eseguire analisi in Tableau utilizzando un modello semantico di Tableau Next.
