Motore dati di Tableau Server

Hyper è la tecnologia del motore dati in memoria di Tableau, ottimizzata per l’assimilazione veloce dei dati e l’elaborazione di query analitiche su insiemi di dati grandi o complessi. Hyper alimenta il motore dati in Tableau Server, Tableau Desktop, Tableau Cloud e Tableau Public. Il motore dati viene utilizzato durante la creazione, l’aggiornamento o la ricerca di estrazioni. Viene inoltre utilizzato per i join tra database per supportare origini dati federate con connessioni multiple.

Processo	Data Engine
Stato	Lo stato del processo Data Engine è visibile nella pagina di stato. Per maggiori informazioni, consulta Visualizzazione dello stato del processo del server
Registrazione	I log generati dal processo Data Engine si trovano in `/var/opt/tableau/tableau_server/data/tabsvc/logs/hyper`. Per maggiori informazioni, consulta Log di Tableau Server e percorsi dei file di log

Utilizzo della memoria e della CPU

Il motore dati è progettato per sfruttare tutta la CPU e la memoria disponibili sulla macchina per fornire i tempi di risposta più rapidi.

Utilizzo della CPU

La tecnologia di Hyper sfrutta i nuovi insiemi di istruzioni nella CPU ed è in grado di parallelizzare e di adattarsi a tutti i core disponibili. La tecnologia di Hyper è progettata in modo da adattarsi a molti core in modo efficiente e da massimizzare il più possibile l’utilizzo di ogni singolo core. Ciò significa che puoi aspettarti di osservare un utilizzo medio della CPU totale all’ora fino al 75% durante l’elaborazione delle query. L’aggiunta di più CPU dovrebbe portare a un miglioramento delle prestazioni.

Nota: l’utilizzo medio orario del 75% è l’impostazione predefinita, che deve essere mantenuta invariata a meno che non si esegua il motore dati su un nodo del server dedicato. Per maggiori informazioni sull’esecuzione del motore dati su un nodo dedicato, consulta Ottimizzazione per ambienti con numerose query di estrazione.

I sistemi operativi moderni, quali Microsoft Windows, Apple macOS e Linux, hanno meccanismi per assicurare che, anche se una CPU è completamente utilizzata, i processi in entrata e altri processi attivi possano girare simultaneamente. Inoltre, per gestire l’utilizzo complessivo delle risorse, evitare sovraccarichi e la completa mancanza di risorse per altri processi in esecuzione sulla macchina, il motore dati si automonitora per rimanere entro i limiti impostati nella gestione risorse del server (SRM) di Tableau. La gestione risorse del server di Tableau esegue il monitoraggio del consumo delle risorse e notifica al motore dati di ridurre l’utilizzo quando supera il limite predefinito.

Poiché il motore dati è progettato per utilizzare la CPU disponibile, è normale vedere a volte picchi nell’utilizzo della CPU. Se tuttavia noti un utilizzo elevato della CPU (es.: 95%) per periodi prolungati di tempo (un’ora o più), questo può significare un paio di cose:

È presente un elevato carico di query. Questo può accadere se un server è sotto stress a causa del sovraccarico di richieste di client multipli e le query sono in coda. Se questo accade spesso, significa che dev’essere potenziato l’hardware per servire i client. L’aggiunta di più CPU in questo caso dovrebbe consentire di migliorare le prestazioni.
È presente una query con una esecuzione lunga. In questo caso, la gestione risorse di Tableau Server interromperà le query di lunga durata in base alle impostazioni di timeout. Ciò valeva anche per le versioni di Tableau Server precedenti alla versione 10.5.

Per maggiori informazioni sulla gestione risorse di Tableau Server, consulta Linee guida generali sulle prestazioni.

Utilizzo della memoria

L’utilizzo della memoria del motore dati dipende dalla quantità di dati necessari per rispondere alla query. Il motore dati cercherà di eseguire l’operazione facendo ricorso in prima battuta alla memoria centrale. Una memoria di lavoro prefissata viene allocata per memorizzare una struttura dati intermedia durante l’elaborazione delle query. Nella maggior parte dei casi, i sistemi dispongono di memoria sufficiente per eseguire questi tipi di elaborazione, ma se non è disponibile una quantità di memoria sufficiente, o se viene utilizzato l’80% della RAM, il motore dati passa allo spooling scrivendo temporaneamente su disco. Il file temporaneo viene eliminato dopo che la query ha ricevuto risposta. Pertanto, lo spooling è un processo che potrebbe essere necessaria più memoria. L’utilizzo della memoria dovrebbe essere monitorato e aggiornato in modo appropriato per evitare problemi di prestazioni causati dallo spooling.

Per gestire le risorse di memoria sulla macchina, il limite massimo di memoria per il motore dati è impostato dalla gestione risorse di Tableau Server.

Configurazione, scalabilità e prestazioni del server

Una singola istanza del motore dati viene installata automaticamente per ogni nodo in cui è installata un’istanza di Archivio file, Server applicazioni (VizPortal), VizQLServer, Data Server o Gestione componenti in background di Tableau Server. Il motore dati è in grado di ridimensionarsi da solo e utilizza la CPU e la memoria necessarie, eliminando così la necessità di istanze multiple del motore dati. Per maggiori informazioni sui processi del server, consulta Processi di Tableau Server.
L’istanza del motore dati installata sul nodo dove è installato Archivio file viene utilizzata per eseguire query sui dati per le richieste di visualizzazione. L’istanza del motore dati installata nel nodo in cui è installato Gestione componenti in background viene utilizzata per la creazione e l’aggiornamento delle estrazioni. Questa è una considerazione importante quando si esegue la messa a punto delle prestazioni. Per maggiori informazioni, consulta Ottimizzazione delle prestazioni.
Data Server, VizQL Server e Server applicazioni (VizPortal) utilizzano tutti l’istanza locale del motore dati per eseguire join tra database e creare estrazioni shadow. I file di estrazione shadow vengono creati solo quando lavori con cartelle di lavoro basate su file Excel o file di testo non legacy, o file statistici. Tableau crea un file di estrazione shadow per caricare i dati più rapidamente.
In Server Tableau 10.5 viene installata automaticamente un’istanza del motore dati quando si installa Gestione componenti in background. Il processo di Gestione componenti in background utilizza la singola istanza del motore dati (hyperd.exe) installata sullo stesso nodo.

Importante! Il motore dati non è necessariamente installato nello stesso nodo dell’archivio file. Quando l’archivio file è configurato esternamente a Tableau Server, il motore dati non viene più installato con l’archivio file. In questa configurazione in cui Tableau Server è configurato con un archivio file esterno, il motore dati continuerà a essere installato con l’altro processo come indicato in precedenza. Inoltre, è anche possibile configurare il motore dati su un nodo senza altri processi, ma solo quando l’archivio file è configurato esternamente. Per maggiori informazioni sull’archivio file esterno, consulta Archivio file esterno di Tableau Server.

Scalabilità

Con il nuovo motore dati puoi implementare la scalabilità: poiché i core sono completamente utilizzati, l’aggiunta di più core fa sì che le singole query vengano eseguite più velocemente, il che a sua volta consente di eseguire più query in meno tempo.

L’utilizzo della memoria deve essere monitorato e aggiornato in modo appropriato per evitare problemi di prestazioni causati dallo spooling.

Per maggiori informazioni sulla scalabilità, consulta Scalabilità di Tableau Server.

Prestazioni

Vantaggi per le prestazioni

A partire dalla versione 10.5, la tecnologia Hyper è stata integrata con il motore dati di Tableau per offrirti i seguenti vantaggi chiave:

Creazione di estrazioni più rapide: con la tecnologia Hyper, le estrazioni vengono generate quasi alla stessa velocità con cui il sistema sorgente è in grado di fornire i dati, senza necessità di ordinamento.
Supporto per estrazioni più grandi: prima di questa versione, avresti potuto non essere in grado di ottenere tutti i tuoi dati in un unica estrazione. Con la tecnologia Hyper, è possibile includere in un unica estrazione quantità di dati molto più grandi.
Analisi delle estrazioni molto più rapida: in molti casi assisterai a una query dei dati più rapida per estrazioni più ampie o per cartelle di lavoro con calcoli complessi.

Ecco alcuni motivi per cui il motore dati alimentato da Hyper funziona meglio su estrazioni più grandi o complesse ed è ottimizzato per un’interrogazione più rapida:

La tecnologia di Hyper è progettata per utilizzare i dati più velocemente. A differenza delle versioni precedenti, il motore dati non effettua alcuna postelaborazione come l’ordinamento. Con Hyper, le fasi di postelaborazione come l’ordinamento non sono necessarie, dando così al motore dati la possibilità di migliorare le prestazioni con estrazioni più grandi.
La tecnologia di Hyper è ottimizzata per la memoria. Questo significa che, quando necessario, tutti i dati "vivono" nella memoria. Questo si traduce in tempi di accesso rapido ai dati.
La tecnologia Hyper è ottimizzata per la CPU. Questo significa che il motore dati ora parallelizza completamente l’esecuzione delle query e utilizza la CPU disponibile in modo tale che il tempo di esecuzione delle query vari quasi linearmente rispetto al numero di core nella macchina.
Hyper è un motore di interrogazione per la compilazione. Le query vengono interpretate o compilate nel codice macchina per ottenere le massime prestazioni e consentire al motore dati di ottenere il massimo delle prestazioni da un hardware moderno (CPU, grandi capacità di memoria principale).
La tecnologia di Hyper utilizza ottimizzazioni avanzate dell’interrogazione per velocizzare le query. Oltre a molte altre tecniche avanzate come, ad esempio, la realizzazione di valori minimi e massimi per ogni colonna, mini indici per ottimizzare gli intervalli di ricerca, dizionari più granulari a livello di blocco di dati, logica avanzata per l’ottimizzazione delle prestazioni di join e subquery, il nuovo motore dati offre molti miglioramenti rispetto al precedente motore dati di Tableau in termini di prestazioni e scalabilità.

Per maggiori informazioni sulle prestazioni, inizia con Linee guida generali sulle prestazioni e con Ottimizzazione delle prestazioni.

Torna in alto

Grazie per il tuo feedback.

Il tuo feedback è stato inviato. Grazie!

Guida di Tableau Server su Linux