Melhorar o desempenho da união entre bancos de dados

Importante: este recurso move temporariamente os dados fora do Tableau. Certifique-se de que o banco de dados ao qual você está conectado é de uma fonte confiável.

A partir da versão 2019.3 do Tableau Desktop e do Tableau Server, é possível melhorar o desempenho ao unir dados de uma conexão de um único arquivo e de uma conexão de um único banco de dados, permitindo que o Tableau execute a união usando o banco de dados ao qual você está conectado ao invés do Hyper. Quando essa opção está habilitada, o Tableau escolhe a opção mais rápida (Hyper ou o banco de dados conectado). Se o Tableau usar o banco de dados conectado, os dados da conexão de arquivo serão movidos para tabelas temporárias no banco de dados e a união será realizada nelas.

Condições de recurso

Essa opção estará disponível somente se as seguintes condições forem atendidas:

  • A fonte de dados consiste em uma ou mais conexões baseadas em arquivos e uma única conexão baseada em SQL.
  • O arquivo é um Microsoft Excel, PDF ou Texto (.csv, .txt, .tsv ou .tab).
  • O banco de dados conectado é um dos seguintes:
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • Vertica
    • Teradata
  • O tipo de união é uma interna.
  • Em criação na Web: a opção Permitir que os usuários utilizem a criação na Web está habilitada.

    Os Administradores de site também podem configurar as opções disponíveis para usuários, definindo as opções União entre bancos de dados na guia Configurações > Geral no Tableau Server. Para obter mais informações sobre essas configurações, consulte Definir um acesso de criação na Web dos sites(O link abre em nova janela) na ajuda do Tableau Server.

Substituição das condições do recurso

A partir da versão 2020.3, como administrador, você pode substituir o tamanho do arquivo, unir as limitações de conexão de arquivo único e forçar o Tableau a usar a conexão de banco de dados em tempo real para executar a conexão. Isso permite que você experimente e determine configurações de desempenho ideais. O requisito de conexão de banco de dados única ainda se aplica.

Para habilitar essa opção, insira as seguintes informações da linha de comando:

  • Tableau de desktop: digite o comando tableau.exe -DForceAlternativeFederationEngine=true.
  • Tableau Server: digite o comando tsm configuration tsm configuration set -k native_api.force_alternative_federation_engine -v true

    Para obter mais informações sobre os valores de configuração no Tableau Server, consulte Opções de tsm configuration set(O link abre em nova janela) na ajuda do Tableau Server.

Habilitar a opção de desempenho da união entre bancos de dados

  1. No Tableau Desktop: na Página inicial, em Conectar, conecte-se a um tipo de arquivo compatível ou tipo de banco de dados compatível. Esta etapa cria a primeira conexão na fonte de dados do Tableau.

    Em criação na Web: na página Inicial ou Explorar, clique em Criar> Pasta de trabalho para iniciar uma nova pasta de trabalho e, em seguida, conectar-se a dados. Esta etapa cria a primeira conexão na fonte de dados do Tableau.

  2. Selecione o arquivo ou o banco de dados ao qual deseja se conectar e clique duas vezes ou arraste uma tabela para a tela.

  3. No painel esquerdo, em Conexões, clique no botão Adicionar (em criação na Web) para adicionar a segunda conexão à fonte de dados do Tableau.

    A opção União entre de bancos de dados é exibida.

    Observação: se você não visualizar essa opção, verifique se está usando apenas fontes de dados compatíveis e se tem apenas duas fontes de dados (um arquivo e um tipo de banco de dados). Caso contrário, o Administrador de site pode ter definido a opção de configuração União entre bancos de dados como somente para o Tableau.

  4. Para alterar a maneira como o Tableau realiza a união, ao lado da opção União entre bancos de dados, clique em Editar.
  5. Na caixa de diálogo União entre bancos de dados, selecione uma das seguintes opções e clique em OK:

    • Usar banco de dados do Tableau ou banco de dados existente. Essa opção permite que o Tableau escolha a opção mais rápida para realizar a união, Hyper ou o banco de dados ao qual você está conectado.

    • Usar somente o Tableau. Essa opção é o padrão e sempre usa o Hyper para realizar a união.

      A opção União entre bancos de dados muda da opção padrão, Uso do Tableau (uso do Hyper), para a nova opção Uso do banco de dados, dependendo do que você escolher.

      Importante: se você selecionar Usar o Tableau ou bancos de dados existentes, o Tableau escolherá a opção mais rápida ao realizar a união. Esse comportamento é predeterminado por um conjunto de critérios, incluindo tipos de união de colunas. Por exemplo, o Tableau sempre escolherá Hyper para uniões de colunas não internas.

      Se o Tableau usar o Hyper para realizar a união, esse processo ocorrerá em segundo plano e nenhum indicador será exibido para identificar onde a união foi realizada.

  6. Adicione uma ou mais cláusulas de união selecionando um campo de uma das tabelas disponíveis usadas na fonte de dados, um operador de união e um campo da tabela adicionada. Inspecione a cláusula de união para verificar se reflete como você deseja conectar às tabelas.

Sobre o trabalho com fontes de dados de várias conexões

Trabalhar com fontes de dados de várias conexões equivale a trabalhar com qualquer outra fonte de dados, com alguns cuidados, discutidos nesta seção.

União de linhas de dados de uma conexão

Para unir dados, deve-se usar tabelas de texto ou do Excel da mesma conexão. Ou seja, não é possível unir tabelas de diferentes bancos de dados. No Tableau Desktop, você pode unir as tabelas em arquivos e pastas de trabalho diferentes do Excel em pastas diferentes. Para obter mais informações, consulte Unir tabelas usando a pesquisa curinga (Tableau Desktop).

Se precisar unir linhas de dados de diferentes bancos de dados, use o Tableau Prep(O link abre em nova janela).

Colação

A colação refere-se a regras de um banco de dados que determina como os valores da cadeia de caracteres devem ser comparados e classificados. Na maioria dos casos, a colação é realizada pelo banco de dados. Entretanto, ao trabalhar com uniões cruzadas de bancos de dados, é necessário unir as colunas com colações diferentes.

Por exemplo, suponha que a sua união cruzada de banco de dados usou uma chave de união com uma coluna sensível a maiúsculas e minúsculas do SQL Server e uma coluna não sensível a maiúsculas e minúsculas da Oracle. Nesses casos, o Tableau mapeia determinadas colações para outras pessoas, a fim de minimizar a interpretação incorreta dos valores.

As regras a seguir são usadas em uniões cruzadas de bancos de dados:

  • Se uma coluna usa padrões de colação dos Componentes Internacionais para Unicode (ICU-International Components for Unicode), o Tableau usa a colação para outra coluna.

  • Se uma coluna usa padrões de colação de ICU, o Tableau usa a colação da coluna da tabela esquerda.

  • Se nenhuma coluna usa os padrões de colação de ICU, o Tableau usa uma colação binária. Uma colação binária significa que o local do banco de dados e do tipo de dados das colunas determina como os valores de cadeia de caracteres devem ser comparados e classificados.

Ao trabalhar com dados do Microsoft Excel, se precisar manter a diferenciação de maiúsculas e minúsculas dos dados ao executar uniões, por exemplo, dados japoneses que diferenciam caracteres Kana, será possível habilitar a opção Manter a diferenciação de maiúsculas e minúsculas (Excel) no menu Dados.

Quando essa opção é selecionada, o Tableau mantém o uso de maiúsculas e minúsculas dos valores da fonte de dados do Excel e identifica exclusivamente os valores com uma capitalização diferente, em vez de combiná-los, resultando em um número diferente de linhas.

Por exemplo, você tem uma planilha com o valor "Casa" e outra com os valores "Casa", "casa" e "caSa". Por padrão, ao unir as duas tabelas, o Tableau ignora a diferenciação de maiúsculas e minúsculas na segunda planilha e une "Casa", "casa" e "caSa" com o valor "Casa" da primeira planilha.

Ao unir as tabelas com a opção Manter a diferenciação de maiúsculas e minúsculas (Excel) habilitada, o Tableau reconhece a diferenciação de maiúsculas e minúsculas dos caracteres. A união mostrará menos resultados, pois apenas o valor "Casa" da primeira planilha e "Casa" da segunda serão combinados e os "casa" e "caSa" serão lidos como valores separados exclusivos.

Observação: esta opção está disponível para todos os idiomas suportados pelo Tableau e não depende da localidade do seu sistema operacional. Essa opção está disponível somente para as fontes de dados do Microsoft Excel.

Cálculos e fontes de dados de várias conexões

Somente um subconjunto de cálculos pode ser usado em uma fonte de dados de várias conexões.

No Tableau Desktop: você poderá usar um cálculo específico se ele for:

  • Compatíveis com todas as conexões na fonte de dados de várias conexões.

  • Compatíveis com extrações do Tableau.

Na criação na Web (Tableau Online e Tableau Server): você poderá usar um cálculo específico se ele for compatível com todas as conexões na fonte de dados com várias conexões.

Procedimentos armazenados

Os procedimentos armazenados não estão disponíveis para fontes de dados com várias conexões.

Dinamização de dados de uma conexão

Para dinamizar dados, use colunas de texto ou do Excel da mesma conexão. Ou seja, não é possível incluir colunas de diferentes bancos de dados em uma dinamização.

Transformar os arquivos de extração na primeira conexão (somente no Tableau Desktop)

Ao conectar-se aos arquivos de extração em uma fonte de dados com várias conexões, certifique-se de que a conexão com o arquivo de extração (.tde ou .hyper) seja a primeira conexão. Isso preserva quaisquer personalizações que podem ser uma parte da extração, incluindo alterações nas propriedades padrão, campos calculados, grupos, aliases etc.

Observação: se precisar se conectar a vários arquivos de extração em sua fonte de dados com várias conexões, apenas as personalizações da extração na primeira conexão serão preservadas.

Extrações de fontes de dados com várias conexões que contêm conexões com dados baseados em arquivo (somente no Tableau Desktop)

Se você estiver publicando uma extração de uma fonte de dados de várias conexões, com uma conexão com dados baseados em arquivo, como Excel, selecionar a opção Incluir arquivos externos coloca uma cópia dos dados baseados em arquivo no servidor como parte da fonte de dados. Neste caso, uma cópia dos seus dados baseados em arquivo pode ser baixada e o conteúdo acessado por outros usuários. Se houver informações confidenciais nos dados baseados em arquivo, que foram excluídos intencionalmente da sua extração, não selecione Incluir arquivos externos ao publicar a fonte de dados.

Para obter mais informações sobre a publicação de fontes de dados, consulte Publicar uma fonte de dados.

Sobre consultas e uniões cruzadas de banco de dados

Para cada conexão, o Tableau envia consultas independentes aos bancos de dados na união. Os resultados são armazenados em uma tabela temporária, no formato de um arquivo de extração.

Por exemplo, suponha que duas conexões foram criadas para duas tabelas, dbo.listings e reviews$. Essas tabelas são armazenadas em dois bancos de dados diferentes, SQL Server e Excel. O Tableau consulta o banco de dados em cada conexão de forma independente. O banco de dados faz a consulta e aplica as personalizações, como filtros e cálculos, e o Tableau armazena os resultados para cada conexão em uma tabela temporária. Neste exemplo, FQ_Temp_1 é a tabela temporária para a conexão com o SQL Server e a FQ_Temp_2 é a tabela temporária para a conexão com o Excel.

Tabela do SQL Server

Tabela do Excel

Quando uma união cruzada de banco de dados é realizada, as tabelas temporárias são unidas pelo Tableau Desktop. Essas tabelas temporárias são necessárias para o Tableau realizar uniões cruzadas de banco de dados.

Após a união das tabelas, "topn" é aplicado para limitar o número de valores mostrados na grade de dados para as primeiras 1.000 linhas. Este filtro é aplicado para manter a capacidade de resposta da grade de dados e o desempenho geral da página Fonte de dados.

Tabelas unidas

Agradecemos seu feedback!