Otimizar para ambientes - com muitas consultas de extração

O tópico fornece orientações sobre como configurar uma topologia e configurações específicas do Tableau Server para ajudar a otimizar e melhorar o desempenho em um ambiente com muitas consultas de extração.

O que é um ambiente com muitas consultas de extração? Extrações e fontes de dados federadas são consultadas durante o carregamento de pastas de trabalho, exibições e painéis, criando muita carga de trabalho de consulta. Portanto, se você tiver muitas extrações e fontes de dados federadas, pode-se dizer que tem um “ambiente com muitas consultas de extração”.

Se o seu ambiente tiver muitas consultas de extração conforme definido acima, as próximas seções podem ajudar você a decidir se esta configuração é a certa para você.

Quando usar esta configuração

Raciocínio principal por trás dessa configuração: Hyper é a tecnologia de Processador de dados otimizada para memória do Tableau, adequada para processamento analítico e ingestão rápida de dados, tornando-o a chave para otimizar cargas de trabalho com muitas consultas. Conforme o uso de extração aumenta, recomendamos configurar o Processador de dados em nós dedicados do cluster do Tableau Server . Essa configuração permite que o Tableau Server dimensione horizontalmente a infraestrutura para otimizar o desempenho ao consultar extrações.

Existem vários fatores que afetam o desempenho do Tableau Server ao exibir conteúdo usando extrações e fontes de dados federadas. O objetivo aqui é obter um desempenho de consulta consistente e confiável ao visualizar o conteúdo no servidor. Use esta configuração, se uma das seguintes condições se aplicar ao seu ambiente:

  • Você está vendo uma grande variabilidade nos tempos de carregamento da pasta de trabalho, e a pasta de trabalho usa extrações ou fontes de dados federadas.

  • A implantação do Tableau Server está crescendo em número de criadores, exploradores, visualizadores e conteúdo baseado em extração, então você deseja dimensionar com eficiência.

  • Você está vendo disputa por recursos entre o Processador de Dados e o VizQL Server quando o Armazenamento de arquivo é apresentado na máquina.
  • Você analisa grandes quantidades de dados. Essa configuração ajuda a otimizar o desempenho em cenários de big data, tanto na ingestão quanto na análise de dados. Para saber mais sobre o Tableau e big data, consulte Análise de big data de carga Hyper usando o Tableau .

Observação: use o registro de desempenho do Server para determinar os tempos de execução de consultas. Para determinar o uso de recurso do Tableau use o Monitor de desempenho para instalações do Windows ou as ferramentas sysstat ou vmstat para instalações do Linux.

Benefícios de usar esta configuração

Estes são os principais benefícios para configurar nós dedicados para o Processador de dados:

  • Os nós dedicados do Processador de dados reduzirão a contenção de recursos entre as consultas de extração e outras cargas de trabalho que consomem muitos recursos, como as processadas pelo VizQL Server.

  • As consultas de extração têm carga balanceada dinamicamente nos nós dedicados, levando em consideração o estado atual do sistema para garantir que nenhum nó seja super ou subutilizado.
  • Desempenho mais consistente na experiência do usuário ao carregar pastas de trabalho dependentes de extração. O foco aqui é estabelecer um desempenho consistente e confiável, em vez de melhorar as consultas individuais.

  • Você tem mais controle sobre a expansão dos processos do Tableau Server que precisam de mais recursos. Se VizQL Server, Processador de dados e Processador em segundo plano estiverem todos em execução no mesmo nó e as consultas de extração lentas forem o problema, será difícil ver melhorias de desempenho adicionando um segundo nó com todos os três processos. Com essa configuração, você pode adicionar mais nós que irão melhorar especificamente as cargas de trabalho de consulta de extração.

  • Ajuda a melhorar a disponibilidade e o tempo de atividade. No caso de uma falha e um dos nós dedicados do Processador de dados não estiver disponível, o VizQL Server tentará rotear as solicitações pendentes no nó do problema para outros nós dedicados do Processador de dados.

  • O Processador de dados aproveita maior quantidade de núcleos disponíveis na máquina. Diante desse quadro, você tem flexibilidade para adicionais mais recursos aos nós dedicados do Processador de dados para reduzir o tempo de resposta da consulta e a variabilidade em consultas de extrações sobrecarregadas ou adicionar mais nós dedicados do Processador de dados para obter mais rendimento da consulta de extração em seu servidor.

  • O Data Engine tem uma configuração padrão que o limita a uma média de 75% da CPU por hora. O objetivo é ajudar a evitar conflitos com outros processos do Tableau Server. Se você estiver executando o Data Engine em um nó dedicado, poderá aumentar essa média para 95%. Para obter informações sobre como gerenciar permissões, consulte hyper.srm_cpu_limit_percentage.

Quando não usar esta configuração

  • Se você não estiver tendo problemas com a carga de consulta baseada em extração, os recursos de hardware podem ser melhor alocados para outras partes do Tableau Server.

  • Em nós onde o Armazenamento de arquivos, o Processador de dados e o VizQL Server coexistem, você não está vendo a contenção de recursos entre o Processador de dados e o VizQL Server.

  • Antes de implementar esta configuração, é fortemente recomendado avaliar uso de CPU para o VizQL Server e o nó em que o Processador de dados está instalado com o Armazenamento de arquivo.

Configuração

O objetivo principal desta configuração é ter o Processador de dados em um ou mais nós dedicados.

  • Em implantações onde o Armazenamento de arquivos é instalado localmente, isso significa configurá-lo em um ou mais nós dedicados. O Processador de dados é instalado automaticamente no mesmo nó que o Armazenamento de Arquivos.

  • Em implantações em que você está configurando o armazenamento de arquivo externo, ainda pode configurar o Processador de dados em nós dedicados no Tableau Server.

Ao separarmos os processos do VizQL Server e do Armazenamento de arquivo, a carga entre a consulta de extrações e a visualização ou a interação com exibições poderá ser balanceada e melhor gerenciada. Esta configuração tem como objetivo um desempenho consistente ao consultar extrações.

Abaixo está uma representação visual da configuração onde os processos do Processador de dados/Armazenamento de arquivo têm dois nós dedicados, nós 5 e 6. Este é um exemplo em que o armazenamento de arquivos é configurado localmente, por isso os processos do Processador de dados e do armazenamento de arquivos estão co-localizados.

A mesma configuração funciona para implantações com armazenamento de arquivo externo, mas os nós 5 e 6 terão apenas o mecanismo de dados configurado nesse caso.

Além disso, como o Nó 1 também tem os processos Repositório e Armazenamento de arquivo, todos os dados necessários para executar um backup existem no Nó 1, o que pode melhorar o desempenho do backup.

Orientação de Hardware

Para obter o máximo dessa configuração, você precisará experimentar vários tamanhos e configurações de hardware para ver o que melhor se adapta aos seus objetivos de desempenho de carga de pico. Hyper é uma tecnologia de banco de dados de alto desempenho e os principais recursos que afetam o desempenho são memória, núcleos e E/S de armazenamento. Entender como o Hyper usa recursos para processar consultas o ajudará a fazer a seleção de hardware e entender o motivo entre as diferentes configurações.

  • Memória: quando uma consulta baseada em extração é processada para um usuário ou processo em segundo plano, o Tableau Server seleciona um nó do Processador de dados dedicado para processar a consulta. Esse nó dedicado do Processador de dados irá então copiar a extração do armazenamento local, na maioria das vezes o disco rígido do servidor, para a memória. Ter mais memória de sistema disponível permite que o sistema operacional gerencie melhor o uso de memória para o Tableau. Nós dedicados do Processador de dados usam a memória do sistema para armazenar o conjunto de resultados das consultas executadas. Se o conjunto de resultados ainda for válido, e o sistema operacional não o tiver apagado da memória, o conjunto de resultados na memória pode ser reutilizado.

    A recomendação mínima de hardware do Tableau Server é 32 GB de memória, mas se você está esperando um alto volume de cargas de pasta de trabalho com base em extração, deve considerar 64 GB ou 128 GB. Se você estiver atingindo outros limites de recursos além da memória (como núcleos), em vez de expandir para 128 GB de memória, pode ser melhor dimensionar para um nó dedicado do Processador de dados adicional de 64 GB.

    O processo de copiar a extração do armazenamento local para a memória pode levar algum tempo e pode ser necessário otimizar o desempenho do disco. A otimização do desempenho do disco é abordada na seção E/S de armazenamento.

  • Cores: ao processar uma consulta baseada em extração, o número de núcleos é um recurso de hardware importante que pode afetar o desempenho e a escalabilidade. Os núcleos da CPU são responsáveis por executar uma consulta e ter mais núcleos disponíveis resultará em um tempo de execução mais rápido. De modo geral, dobrar o número de núcleos reduzirá o tempo de execução da consulta pela metade. Por exemplo, uma consulta de 10 segundos utilizando atualmente 4 núcleos físicos ou 8 vCPUs levará 5 segundos se você atualizar para 8 núcleos físicos ou 16 vCPUs.

    A recomendação mínima atual de hardware do Tableau Server é de 8 núcleos, mas se sua implantação utiliza extrações, considere máquinas de 16 ou 32 núcleos. É importante observar que, se a memória e a E/S forem seus gargalos, aumentar os núcleos disponíveis não melhorará o desempenho da consulta.

  • E/S de armazenamento: o Hyper foi projetado para aproveitar o desempenho disponível de seu dispositivo de armazenamento de extração para acelerar o processamento de consultas. Recomendamos escolher o armazenamento em disco rápido, como unidades de estado sólido (SSD) com altas velocidades de leitura/gravação. Atualmente, os SSDs que utilizam o protocolo de armazenamento NVMe oferecem as velocidades mais rápidas disponíveis.

Nota: o dimensionamento de recursos para nós dedicados do Processador de dados afeta apenas o desempenho da consulta de extração. Ao carregar uma pasta de trabalho, há muitos outros processos envolvidos que compõem o tempo total de solicitação de carregamento do VizQL. O processo do VizQL Server, por exemplo, é responsável por pegar os dados do Processador de dados e renderizar a visualização.

Outros ajustes e otimizações de desempenho:

Existem recursos adicionais que você pode usar para otimizar o desempenho além da configuração básica descrita acima. As otimizações descritas abaixo são aplicáveis às implantações de armazenamento de arquivo local e armazenamento de arquivo externo.

  • Balanceamento de carga de consulta de extração: para determinar para onde rotear a consulta de extração, o Processador de dados usa uma métrica de integridade do servidor - a quantidade de recursos que o Processador de dados está consumindo e a carga de outros processos do Tableau que podem estar em execução no mesmo nó. Além de avaliar os recursos do sistema, se uma extração já existe na memória do nó também é levado em consideração para garantir que uma consulta de extração seja enviada ao nó que tem mais recursos disponíveis para processar a consulta. Isso resulta em memória e utilização de disco mais eficientes, e as extrações não são duplicadas na memória entre os nós. Consulte o artigo de ajuda Balanceamento de carga de consulta de extração para obter mais detalhes.

    O recurso de balanceamento de carga de consulta de extração é habilitado por padrão no Tableau Server versão 2020.2 e posterior.

  • Otimizações de carga de trabalho usando funções de nó: Com as funções de nó do Processador em segundo plano e Armazenamento de arquivos, os administradores de servidor têm mais flexibilidade e controle sobre quais nós devem ser dedicados para executar consultas de extração e atualizações de extração. Conforme mencionado no diagrama de topologia acima, determinados nós do Processador de dados são dedicados ao processamento de consultas de extração e executam apenas os processos de Armazenamento de arquivos e Processador de dados. As funções do nó estão disponíveis com Advanced Management. Para obter mais informações sobre as funções de dados, consulte Gerenciamento de carga de trabalho por meio das funções de nó.

O diagrama abaixo usa a mesma topologia que a configuração básica descrita acima, mas com as funções do nó.

  • Função de nó do processador em segundo plano de atualizações de extração: ao configurar o Nó 3 para a função do nó de Processador em segundo plano de atualizações de extração, somente atualizações incrementais, atualizações completas e trabalhos de criptografia/descriptografia serão executados neste nó. Ao configurar o Nó 4 para a função de nó do processador em segundo plano sem atualizações de extração, todos os trabalhos em segundo plano, exceto atualizações de extração, serão executados neste nó. O Data Server e o Gateway ajudam as tarefas de atualização de extração ao usar extrações federadas e de sombra. Para obter mais informações sobre as funções de nó do Processador em segundo plano, consulte Funções de nó de armazenamento de arquivos.

    Além disso, como o Nó 1 também tem os processos Repositório e Armazenamento de arquivo, todos os dados necessários para executar um backup existem no Nó 1, o que pode melhorar o desempenho do backup.

    A função de nó do Processador em segundo plano está disponível com Advanced Management no Tableau Server versão 2019.3 e posterior.

  • Função de nó de Armazenamento de arquivo de consultas de extração: os nós 5 e 6, que são os nós dedicados do Processador de dados, têm a função de nó de Armazenamento de arquivo de consultas de extração para garantir que processem apenas consultas para carregamentos de visualização, assinaturas e alertas controlados por dados.
  • Função de nó de Armazenamento de arquivo interativo de Extrair Consultas: para nós de Processador de dados dedicados que têm função de nó Armazenamento de arquivos de consultas de extração, os administradores de servidor podem isolar ainda mais as cargas de trabalho interativas e agendadas para execução em nós de Processador de dados dedicados específicos. Isso é útil quando há muitos usuários interagindo e carregando pastas de trabalho durante os períodos de assinatura de alto volume. Por exemplo, digamos que haja 1.000 assinaturas programadas para as manhãs de segunda-feira às 8h. Ao mesmo tempo, muitos usuários também carregam painéis no início do dia. O volume combinado de assinaturas e consultas de usuários pode resultar em tempos de carregamento de pasta de trabalho mais lentos e variáveis. Com a função de nó de Armazenamento de arquivo de Extrair consulta interativa, você pode designar nós de Processador de dados dedicados para aceitar apenas consultas para usuários interativos (aqueles que estão olhando para suas telas esperando). Esses nós dedicados do Processador de dados priorizados para cargas de trabalho interativas seriam protegidos do alto volume de trabalhos de assinatura concorrentes e forneceriam tempos de consulta mais consistentes. Além disso, os administradores de servidores podem usar essa função de nó para planejar melhor o crescimento, pois podem adicionar nós de mecanismo de dados dedicados para cargas de trabalho interativas e agendadas de forma independente. Para obter mais informações, consulte Funções de nó de armazenamento de arquivos.

    A função de nó de Armazenamento de arquivo está disponível com Advanced Management no Tableau Server versão 2020.4 e posterior.

  • Otimizações usando armazenamento de arquivo externo: este recurso permite que você use um compartilhamento de rede como armazenamento para armazenamento de arquivo em vez de usar o disco local em um nó do Tableau Server. Ao ter o armazenamento em um local centralizado, você pode reduzir significativamente a quantidade de tráfego de rede gasta na replicação de dados entre os nós de armazenamento de arquivos. Por exemplo, no caso em que o armazenamento de arquivos está usando um disco local, quando uma extração de 1 GB é atualizada usando o armazenamento de arquivos local, o 1 GB de dados é replicado pela rede para todos os nós que estão executando o processo de armazenamento de arquivos. Quando o Tableau Server está configurado com armazenamento de arquivo externo, a extração de 1 GB só precisa ser copiada para o compartilhamento de rede uma vez e todos os nós de armazenamento de arquivo podem acessar essa única cópia. A centralização do armazenamento também reduz a quantidade total de armazenamento local necessária nos nós de armazenamento de arquivos.

    Além disso, os backups do Tableau Server aproveitam a tecnologia de instantâneo para reduzir significativamente o tempo para concluir um backup.

    Embora você não precise de uma configuração de nó do Processador de dados dedicado para obter os benefícios do Armazenamento de arquivo externo, os recursos adicionais de gerenciamento de carga de trabalho com a função de nó Armazenamento de arquivo e a função de nó Extrair consulta interativa podem ser usados juntos. Consulte o tópico Armazenamento de arquivos externo do Tableau Server do Tableau Server para obter mais detalhes.

    O Armazenamento de arquivo externo está disponível com Advanced Management no Tableau Server versão 2020.1 e posterior.

     

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!