Parte 2 - Compreensão da Arquitetura de referência de implantação do Tableau Server
A imagem a seguir mostra os processos relevantes do Tableau Server e como eles são implantados na arquitetura de referência. Essa implantação é considerada a implantação mínima apropriada do Tableau Server para a empresa.
Os diagramas de processo neste tópico destinam-se a mostrar os principais processos de definição de cada nó. Existem muitos processos compatíveis que também são executados nos nós que não são mostrados nos diagramas. Para obter uma lista de todos os processos, consulte a seção de configuração deste guia, Parte 4 - Instalar e configurar o Tableau Server .
Processos do Tableau Server
A arquitetura de referência do Tableau Server é uma implantação de cluster do Tableau Server de quatro nós com repositório externo no PostgreSQL:
- Nó inicial do Tableau Server (Nó 1): executa os serviços de licenciamento e administrativos TSM necessários que só podem ser executados em um único nó no cluster. No contexto empresarial, o nó inicial do Tableau Server é o nó primário do cluster. Esse nó também executa serviços de aplicativo redundantes com o Nó 2.
- Nós de aplicativo do Tableau Server (Nó 1 e Nó 2): os dois nós atendem às solicitações do cliente, conectam-se e consultam as fontes de dados e os nós de dados.
- Nós de dados do Tableau Server (Nó 3 e Nó 4): dois nós dedicados ao gerenciamento de dados.
- PostgreSQL externo: esse host executa o processo de repositório do Tableau Server. Para implantação de HA, você deve executar um host PostgreSQL adicional para redundância ativa/passiva.
Você também pode executar o PostgreSQL no Amazon RDS. Para obter mais informações sobre as diferenças entre executar o repositório em RDS e uma instância EC2, consulte Repositório externo do Tableau Server (Linux(O link abre em nova janela)).
A implantação do Tableau Server com um repositório externo requer uma licença do Tableau Advanced Management.
Se a sua organização não tiver experiência interna em DBA, você pode, opcionalmente, executar o processo de repositório do Tableau Server na configuração PostgreSQL interna padrão. No cenário padrão, o Repositório é executado em um nó do Tableau com PostgreSQL incorporado. Nesse caso, recomendamos executar o Repositório em um nó dedicado do Tableau e um Repositório passivo em um nó dedicado adicional, para dar suporte ao failover do Repositório. Consulte Failover do repositório ( Linux(O link abre em nova janela) ).
A título de exemplo, a implementação da AWS descrita neste Guia explica como implantar o repositório externo no PostgreSQL em execução em uma instância EC2.
Opcional: se sua organização usa armazenamento externo, você pode implantar o Armazenamento de arquivo do Tableau como um serviço externo. Este guia não inclui o armazenamento de arquivo externo no cenário de implantação principal. Consulte Instalar o Tableau Server com o armazenamento de arquivos externo (Linux(O link abre em nova janela)).
A implantação do Tableau Server com um Armazenamento de arquivo requer uma licença do Tableau Advanced Management.
Repositório PostgresSQL
O Repositório do Tableau Server é um banco de dados que armazena dados do servidor. Estes dados incluem informações sobre usuários, grupos e atribuições de grupo, permissões, projetos, fontes de dados e informações de metadados e atualização de extração do Tableau Server.
A implantação padrão do PostgresSQL consome quase 50% dos recursos de memória do sistema. Com base no uso (para produção e implantações de grande produção), a utilização de recursos pode aumentar. Por esse motivo, recomendamos a execução do processo de Repositório em um computador que não esteja executando nenhum outro componente de servidor que consuma muitos recursos, como VizQL, Processador em segundo plano ou Processador de dados. Executar o processo do Repositório com qualquer um desses componentes criará contenções de ES, restrição de recursos e degradará o desempenho geral da implantação.
Nó 1: nó inicial
O nó inicial executa um pequeno número de processos importantes e compartilha a carga do aplicativo com o nó 2.
O primeiro computador no qual você instalou o Tableau, o "nó inicial”, tem algumas características únicas. Três processos executam apenas no nó inicial e não podem ser movidos para qualquer outro nó exceto em uma situação de falha, o Serviço de Licença (Gerenciador de licenças), o Serviço de Ativação e o Controlador do TSM (Controlador de administração).
Failover do nó 1 e restauração automatizada
Os serviços de Licença, Ativação e Controlador TSM são essenciais para a integridade de uma implantação do Tableau Server. No caso de uma falha do Nó 1, os usuários ainda poderão se conectar à implantação do Tableau Server, pois uma arquitetura de referência configurada corretamente encaminhará as solicitações para o Nó 2. No entanto, sem esses serviços principais, a implantação estará em um estado crítico de falha pendente. Consulte Recuperação automatizada de nó inicial.
Nós 1 e 2: servidores de aplicativos
Os nós 1 e 2 executam os processos do Tableau Server que atendem às solicitações do cliente, consultam fontes de dados, geram visualizações, lidam com conteúdo e administração e outras lógicas comerciais principais do Tableau. Os servidores de aplicativos não armazenam dados do usuário.
Observação: "Servidor de aplicativos" é um termo que também se refere a um processo do Tableau Server listado no TSM. O processo subjacente para "Servidor de aplicativos" é o VizPortal.
Executados em paralelo, o Nó 1 e o Nó 2 são dimensionados para atender às solicitações da lógica de balanceamento de carga executada nos servidores proxy reversos. Como nós redundantes, se um desses nós falhar, as solicitações e serviços do cliente serão tratados pelo nó restante.
A arquitetura de referência foi projetada para que os processos de aplicativos complementares sejam executados no mesmo computador. Isso significa que os processos não estão competindo por recursos de computação e criando contenção.
Por exemplo, o VizQL, um serviço de processamento central em servidores de aplicativos, é altamente vinculado à CPU e à memória, o VizQL usa quase 60-70% da CPU e da memória do computador. Por esse motivo, a arquitetura de referência é projetada para que nenhum outro processo de vinculado à memória ou à CPU esteja no mesmo nó que o VizQL. O teste mostra que a quantidade de carga ou o número de usuários não afeta a memória ou o uso da CPU nos nós VizQL. Por exemplo, reduzir o número de usuários simultâneos em nosso teste de carga afeta apenas o desempenho do painel ou o processo de carregamento da visualização, mas não reduz a utilização de recursos. Portanto, com base na memória e CPU disponíveis durante o uso de pico, você pode considerar adicionar mais processos VizQL. Como ponto de partida para pastas de trabalho típicas, aloque 4 núcleos por processo VizQL.
Dimensionamento de servidores de aplicativos
A arquitetura de referência é projetada para escala com base em um modelo baseado no uso. Como ponto de partida geral, recomendamos um mínimo de dois servidores de aplicativos, cada um aceitando até 1.000 usuários. Conforme a base de usuários aumenta, planeje adicionar um servidor de aplicativos para cada 1000 usuários adicionais. Monitore o uso e o desempenho para ajustar a base de usuários por host para sua organização.
Nós 3 e 4: servidores de dados
Os processos Armazenamento de arquivos, Processo de dados (Hyper) e Processador em segundo plano estão colocalizados nos nós 3 e 4 pelos seguintes motivos:
- Otimização de extração: a execução de Processador em segundo plano, Hyper e Armazenamento de arquivos no mesmo nó otimiza o desempenho e a confiabilidade. Durante o processo de extração, o Processador em segundo plano consulta o banco de dados de destino, cria o arquivo Hyper no mesmo nó e, em seguida, carrega para o armazenamento de arquivos. Ao colocalizar esses processos no mesmo nó, o fluxo de trabalho de criação da extração não exige a cópia de quantias de dados pela rede ou pelos nós.
- Balanceamento de recursos complementar: o Processador em segundo plano usa principalmente a CPU. O Processador de dados é um processo que consome muita memória. A união desses processos permite a utilização máxima de recursos em cada nó.
- Consolidação de processos de dados: como cada um desses processos são de dados de back-end, faz sentido executá-los no nível de dados mais segura. Em versões futuras da arquitetura de referência, o aplicativo e os servidores de dados serão executados em níveis separados. No entanto, devido às dependências do aplicativo na arquitetura do Tableau, os servidores de aplicativos e dados devem ser executados no mesmo nível neste momento.
Dimensionamento de servidores de dados
Assim como acontece com os servidores de aplicativos, o planejamento dos recursos necessários para os servidores de dados Tableau requer modelagem baseada no uso. Em geral, suponha que cada servidor de dados possa aceitar até 2.000 trabalhos de atualização de extração por dia. À medida que seus trabalhos de extração aumentam, adicione servidores de dados adicionais sem o serviço de armazenamento de arquivo. Geralmente, a implantação do servidor de dados de dois nós é adequada para implantações que usam o sistema de arquivos local para o serviço de Armazenamento de arquivo. Observe que adicionar mais servidores de aplicativos não afeta o desempenho ou a escala dos servidores de dados de maneira linear. Na verdade, com exceção de alguma sobrecarga de consultas adicionais do usuário, o impacto de adicionar mais hosts de aplicativos e usuários é mínimo.