Data engine di Tableau Server

Hyper è la tecnologia del data engine della memoria centrale di Tableau, ottimizzata per l'assimilazione veloce dei dati e l'elaborazione di query analitiche su insiemi di dati grandi o complessi. Partendo dalla versione 10.5 di Tableau, Hyper alimenta il data engine in Tableau Server, Tableau Desktop, Tableau Online e Tableau Public. Il data engine viene utilizzato durante la creazione, l'aggiornamento o la ricerca di estrazioni. Viene inoltre utilizzato per i join tra database per supportare origini dati federate con connessioni multiple.

Processo

Data Engine

Stato Lo stato del processo Data Engine è visibile nella pagina di stato. Per maggiori informazioni, consulta Visualizzazione dello stato del processo del server
Logging I log generati dal processo Data Engine si trovano in /var/opt/tableau/tableau_server/data/tabsvc/logs/hyper. Per maggiori informazioni, consulta Percorsi dei file di log del server nell'archivio ziplog

Utilizzo della memoria e della CPU

Il data engine è progettato per sfruttare tutta la CPU e la memoria disponibili sulla macchina per fornire i tempi di risposta più rapidi.

Utilizzo della CPU

La tecnologia di Hyper sfrutta i nuovi insiemi di istruzioni nella CPU ed è in grado di parallelizzare e di adattarsi a tutti i core disponibili. La tecnologia di Hyper è progettata in modo da adattarsi a molti core in modo efficiente e da massimizzare il più possibile l'utilizzo di ogni singolo core. Ciò significa che ti puoi aspettare di vedere la CPU utilizzata completamente durante l'elaborazione delle query. L'aggiunta di più CPU dovrebbe portare a un miglioramento delle prestazioni.

I sistemi operativi moderni, quali Microsoft Windows, Apple macOS e Linux, hanno meccanismi per assicurare che, anche se una CPU è completamente utilizzata, i processi in entrata e altri processi attivi possano girare simultaneamente. Inoltre, per gestire l'utilizzo complessivo delle risorse, evitare sovraccarichi e la completa mancanza di risorse per altri processi in esecuzione sulla macchina, il data engine si automonitora per rimanere entro i limiti impostati nella gestione risorse del server (SRM) di Tableau. La gestione risorse del server di Tableau esegue il monitoraggio del consumo delle risorse e notifica al data engine di ridurre l'utilizzo quando supera il limite predefinito.

Poiché il data engine è progettato per utilizzare la CPU disponibile, è normale vedere a volte picchi nell'utilizzo della CPU. Se tuttavia noti un utilizzo elevato della CPU (es.: 95%) per periodi prolungati di tempo (un'ora o più), questo può significare un paio di cose:

  • È presente un elevato carico di query. Questo può accadere se un server è sotto stress a causa del sovraccarico di richieste di client multipli e le query sono in coda. Se questo accade spesso, significa che dev'essere potenziato l'hardware per servire i client. L'aggiunta di più CPU in questo caso dovrebbe consentire di migliorare le prestazioni.

  • È presente una query con una esecuzione lunga. In questo caso, la gestione risorse di Tableau Server interromperà le query di lunga durata in base alle impostazioni di timeout. Ciò valeva anche per le versioni di Tableau Server precedenti alla versione 10.5.

Per maggiori informazioni sulla gestione risorse di Tableau Server, consulta Linee guida generali sulle prestazioni.

Utilizzo della memoria

L'utilizzo della memoria del data engine dipende dalla quantità di dati necessari per rispondere alla query. Il data engine cercherà di eseguire l'operazione facendo ricorso in prima battuta alla memoria centrale. Una memoria di lavoro prefissata viene allocata per memorizzare una struttura dati intermedia durante l'elaborazione delle query. Nella maggior parte dei casi, i sistemi dispongono di memoria sufficiente per eseguire questi tipi di elaborazione, ma se non è disponibile una quantità di memoria sufficiente, o se viene utilizzato l'80% della RAM, il data engine passa allo spooling scrivendo temporaneamente su disco. Il file temporaneo viene eliminato dopo che la query ha ricevuto risposta. Pertanto, lo spooling è un processo che potrebbe essere necessaria più memoria. L'utilizzo della memoria dovrebbe essere monitorato e aggiornato in modo appropriato per evitare problemi di prestazioni causati dallo spooling.

Per gestire le risorse di memoria sulla macchina, il limite massimo di memoria per il data engine è impostato dalla gestione risorse di Tableau Server.

Configurazione, scalabilità e prestazioni del server

  • Una singola istanza del motore dati viene installata automaticamente per ogni nodo in cui è installata un'istanza di archivio file, server delle applicazioni (VizPortal), VizQLServer, server di dati o gestione componenti in background di Tableau Server. Il data engine è in grado di ridimensionarsi da solo e utilizza la CPU e la memoria necessarie, eliminando così la necessità di istanze multiple del data engine. Per maggiori informazioni sui processi del server, consulta Processi di Tableau Server.

  • L'istanza del motore dati installata sul nodo dove è installato Archivio file viene utilizzata per eseguire query sui dati per le richieste di visualizzazione. L'istanza del data engine installata sul nodo dove è installata la selezione background viene utilizzata per la creazione e l'aggiornamento degli estratti. Questa è una considerazione importante quando si esegue la messa a punto delle prestazioni. Per maggiori informazioni, consulta Esempi di ottimizzazione delle prestazioni.

  • Il server dati, il server di VizQL e il server applicazioni (VizPortal) utilizzano tutti l'istanza locale del data engine per fare join tra database e creare estrazioni shadow. I file di estrazione shadow vengono creati solo quando lavori con cartelle di lavoro basate su file Excel o file di testo non legacy, o file statistici. Tableau crea un file di estrazione shadow per caricare i dati più rapidamente.

  • In Server Tableau 10.5 viene installata automaticamente un'istanza del data engine quando si installa la selezione background. Il processo di selezione background utilizza la singola istanza del data engine (hyperd.exe) installata sullo stesso nodo.

Importante! Il motore dati non è necessariamente installato nello stesso nodo dell'archivio file. Quando l'archivio file è configurato esternamente a Tableau Server, il motore dati non viene più installato con l'archivio file. In questa configurazione in cui Tableau Server è configurato con un archivio file esterno, il motore dati continuerà a essere installato con l'altro processo come indicato in precedenza. Inoltre, è anche possibile configurare il motore dati su un nodo senza altri processi, ma solo quando l'archivio file è configurato esternamente. Per maggiori informazioni sull'archivio file esterno, consulta Archivio file esterno di Tableau Server.

Scalabilità

Con il nuovo data engine puoi implementare la scalabilità: poiché i core sono completamente utilizzati, l'aggiunta di più core fa sì che le singole query vengano eseguite più velocemente, il che a sua volta consente di eseguire più query in meno tempo.

L'utilizzo della memoria deve essere monitorato e aggiornato in modo appropriato per evitare problemi di prestazioni causati dallo spooling.

Per maggiori informazioni sulla scalabilità, consulta Scalabilità di Tableau Server.

Prestazioni

Come accennato all'inizio di questo argomento, nella maggior parte dei casi ci si può aspettare miglioramenti delle prestazioni quando si passa a Tableau 10.5 o successivi. In alcuni casi, tuttavia, potrebbero verificarsi problemi di prestazioni come tempi di risposta più lenti, soprattutto per cartelle di lavoro con calcoli complessi. Per testare le cartelle di lavoro e vedere se ci si devono aspettare problemi di prestazioni, ti consigliamo di eseguire il controllo prima di effettuare l'aggiornamento. Per maggiori informazioni, consulta Provare le prestazioni della cartella di lavoro. Se hai già effettuato l'aggiornamento di Tableau Server, vedi Risolvere con i calcoli i problemi delle prestazioni delle cartelle di lavoro.

Per maggiori informazioni sulle prestazioni, inizia con Linee guida generali sulle prestazioni e con Ottimizzazione delle prestazioni.

Vantaggi per le prestazioni

A partire dalla versione 10.5, la tecnologia Hyper è stata integrata con il data engine di Tableau per offrirti i seguenti vantaggi chiave:

  • Creazione di estrazioni più rapide: con la tecnologia Hyper, le estrazioni vengono generate quasi alla stessa velocità con cui il sistema sorgente è in grado di fornire i dati, senza necessità di ordinamento.

  • Supporto per estrazioni più grandi: prima di questa versione, avresti potuto non essere in grado di ottenere tutti i tuoi dati in un unica estrazione. Con la tecnologia Hyper, è possibile includere in un unica estrazione quantità di dati molto più grandi.

  • Analisi delle estrazioni molto più rapida: in molti casi assisterai a una query dei dati più rapida per estrazioni più ampie o per cartelle di lavoro con calcoli complessi.

Ecco alcuni motivi per cui il data engine alimentato da Hyper funziona meglio su estratti più grandi o complessi ed è ottimizzato per un'interrogazione più rapida:

  • La tecnologia di Hyper è progettata per utilizzare i dati più velocemente. A differenza delle versioni precedenti, il data engine non effettua alcuna postelaborazione come l'ordinamento. Con Hyper, le fasi di postelaborazione come l'ordinamento non sono necessarie, dando così al data engine la possibilità di migliorare le prestazioni con estrazioni più grandi.

  • La tecnologia di Hyper è ottimizzata per la memoria. Questo significa che, quando necessario, tutti i dati "vivono" nella memoria. Questo si traduce in tempi di accesso rapido ai dati.

  • La tecnologia Hyper è ottimizzata per la CPU. Questo significa che il data engine ora parallelizza completamente l'esecuzione delle query e utilizza la CPU disponibile in modo tale che il tempo di esecuzione delle query vari quasi linearmente rispetto al numero di core nella macchina.

  • Hyper è un motore di interrogazione per la compilazione. Le query vengono interpretate o compilate nel codice macchina per ottenere le massime prestazioni e consentire al data engine di ottenere il massimo delle prestazioni da un hardware moderno (CPU, grandi capacità di memoria principale).

  • La tecnologia di Hyper utilizza ottimizzazioni avanzate dell'interrogazione per velocizzare le query. Oltre a molte altre tecniche avanzate come, ad esempio, la realizzazione di valori minimi e massimi per ogni colonna, mini indici per ottimizzare gli intervalli di ricerca, dizionari più granulari a livello di blocco di dati, logica avanzata per l'ottimizzazione delle prestazioni di join e subquery, il nuovo data engine offre molti miglioramenti rispetto al precedente data engine di Tableau in termini di prestazioni e scalabilità.

Grazie per il tuo feedback. Si è verificato un errore durante l'invio del feedback. Riprova o scrivici.