Relacionar os dados

As relações são uma forma dinâmica e flexível de combinar dados de várias tabelas para análises. Uma relação descreve como duas tabelas estão relacionadas entre si, com base nos campos comuns, mas não mescla as tabelas. Quando uma relação é criada entre tabelas, as tabelas permanecem separadas, mantendo seu nível individual de detalhe e domínios.

Pense em uma relação como um contrato entre duas tabelas. Quando você está criando uma visualização com campos dessas tabelas, o Tableau traz dados dessas tabelas usando esse contrato para criar uma consulta com as uniões de colunas apropriadas.

Saiba mais: a capacidade de combinar os dados usando relacionamentos é uma característica importante dos novos recursos de modelagem de dados do Tableau. Para obter mais informações, consulte Alterações nas fontes de dados e análises(O link abre em nova janela). Saiba mais sobre como as relações funcionam nessas publicações no blog do Tableau:

Assista a um vídeo: para obter uma introdução ao uso de relações no Tableau, assista a este vídeo de 5 minutos.

Observação: a interface para edição de relacionamentos mostrada neste vídeo difere um pouco da versão atual, mas tem a mesma funcionalidade.

O Action Analytics(O link abre em nova janela) também fornece pddcasts de vídeo úteis sobre o uso de relacionamentos no Tableau. Para obter uma introdução, consulte Por que o Tableau inventou os relacionamentos?(O link abre em nova janela) Clique em "Podcast de vídeo" na Biblioteca(O link abre em nova janela) do site Action Analytics para ver outros podcasts.

O que são relações?

As relações são as linhas de conexão flexíveis criadas entre as tabelas lógicas na fonte de dados. Algumas pessoas carinhosamente chamam as relações de "noodles", mas nos referimos a elas como "relações" em nossa documentação de ajuda.

Recomenda-se o uso de relacionamentos como uma primeira abordagem para combinar os dados, pois isso torna a preparação e a análise de dados mais fáceis e intuitivas. Usar as uniões somente quando você realmente precisar(O link abre em nova janela).

As relações oferecem várias vantagens em comparação ao uso de uniões de colunas para dados de várias tabelas:

  • Não é necessário configurar os tipos de união de colunas(O link abre em nova janela) entre as tabelas. Você só precisa selecionar os campos para definir a relação.
  • As tabelas relacionadas permanecem separadas e distintas; elas não são mescladas em uma única tabela.
  • As relações usam uniões de colunas, mas são automáticas. O Tableau seleciona automaticamente os tipos de união de colunas com base nos campos usados na visualização. Durante a análise, o Tableau ajusta os tipos de união de colunas de forma inteligente e preserva o nível nativo de detalhe nos dados.
  • O Tableau usa relações para gerar as agregações corretas e as uniões de colunas apropriadas durante a análise, com base no contexto atual dos campos em uso em uma planilha.
  • Várias tabelas em diferentes níveis de detalhe são compatíveis em uma única fonte de dados. É possível criar modelos de dados com mais tabelas e reduzir o número de fontes de dados necessárias para criar uma visualização.
  • Os valores de medida sem correspondência não são descartados (não há perda acidental de dados).
  • Usar relacionamentos de problemas de duplicação e filtragem de dados que às vezes podem resultar de uniões de colunas.
  • O Tableau gera consultas apenas para os dados relevantes para a exibição atual.

Requisitos para relações

  • Ao relacionar tabelas, os campos que definem as relações devem ter o mesmo tipo de dados.
  • Não é possível definir relações com base em campos geográficos.
  • Relações circulares não são aceitos no modelo de dados.
  • Não é possível definir relações entre fontes de dados publicadas.

Os fatores que limitam os benefícios do uso de tabelas relacionadas são:

Dados que não podem ser relacionados

A maioria dos tipos de conexão relacional é completamente compatível. Cubos, SAP HANA (com atributo OLAP), JSON e Google Analytics estão limitados a uma única tabela lógica no Tableau 2020.2. Os procedimentos armazenados só podem ser usados em uma única tabela lógica.

As fontes de dados publicadas não podem estar relacionadas umas às outras.

Incompatíveis

  • Os bancos de dados de cubo não são compatíveis com a nova camada lógica. Conectar-se a um cubo oferece a mesma experiência que as versões anteriores à versão 2020.2.
  • Procedimentos armazenados: não são compatíveis com federação, relações ou uniões de colunas. São representados em uma única tabela lógica e não permitem abrir o canvas União de colunas/União de linhas (camada física).
  • Splunk: não é compatível com uniões de colunas à esquerda (e, portanto, relações de tabelas lógicas).
  • JSON: não é compatível com federação, SQL personalizado, uniões de colunas ou relações (apenas uniões de linhas).
  • Fontes de dados de dados que não são compatíveis com cálculos de LOD. Para obter mais informações, consulte Restrições de fonte de dados para expressões de nível de detalhe(O link abre em nova janela).

Suporte limitado

  • Salesforce e WDC Standard Connections: são representadas como tabelas com união de colunas dentro de uma tabela lógica. No momento, adicionar essas conexões é compatível apenas para fontes de dados de uma única tabela lógica. As conexões padrão não podem unir colunas em uma tabela existente.
  • SAP HANA: no momento, não é compatível com relações de tabelas lógicas quando a conexão possui o conjunto de atributos OLAP.

Criar e definir relações

Para um único modelo de tabela base, depois de arrastar a primeira tabela para a tela de nível superior da fonte de dados, cada nova tabela arrastada para a tela deve estar relacionada a uma tabela existente. Quando você cria relações entre tabelas na camada lógica, está criando o modelo de dados para sua fonte de dados.

Na versão 2024.2 e posteriores: para vários modelos de tabela base, cada nova tabela adicionada ao modelo deve estar relacionada em pelo menos uma árvore de tabela base. Para obter mais informações, veja Construir um modelo de dados de relação de vários fatos(O link abre em nova janela).

Criar uma relação

Crie relações na camada lógica da fonte de dados. Esta é a exibição padrão da tela que você vê na página Fontes de dados.

As etapas deste tópico abordam especificamente como configurar relacionamentos para um modelo de tabela base único.

na versão 2024.2 e posterior, você pode construir um modelo de tabela base única ou um modelo de tabela base múltipla. Para obter informações sobre como criar relação de vários fatos com diversas tabelas base, consulte Construir um modelo de dados de relação de vários fatos(O link abre em nova janela).

  1. Arraste uma tabela para a tela.
    • Para um modelo de tabela base única: a primeira tabela adicionada à tela se torna a tabela base. Todas as outras tabelas que você adicionar estarão relacionadas a essa tabela.

    • Para um modelo de tabela base múltipla: você precisará decidir quais tabelas são tabelas base. Para criar outra tabela base, arraste uma tabela do painel esquerdo e solte em Nova tabela base. Para obter mais informações, veja Construir um modelo de dados de relação de vários fatos(O link abre em nova janela).

  2. Arraste outra tabela para a tela. Quando você vir a "noodle" entre as duas tabelas que deseja relacionar, solte a tabela.

    As configurações de relacionamento são abertas abaixo da tela no painel Detalhes da tabela. O Tableau tenta criar automaticamente a relação com base nas restrições de chave existentes e nos campos correspondentes para definir a relação. Se não puder determinar os campos correspondentes, selecione-os.

    Para alterar os campos: selecione um par de campos e uma lista de campos abaixo para definir um novo par de campos correspondentes.

    Para adicionar vários pares de campos: depois de selecionar o primeiro par, selecione Fechar e, depois, selecione Adicionar mais campos.

    Se nenhuma restrição for detectada, uma relação Muitos para muitos será criada e a integridade referencial será definida como Alguns registros correspondem. Essas configurações padrão são uma escolha segura e fornecem o máximo de flexibilidade para sua fonte de dados. As configurações padrão aceitam uniões de colunas externas completas e otimizam as consultas agregando dados de tabela antes de formar as uniões de colunas durante a análise. Todos os dados de coluna e de linha em cada tabela se tornam disponíveis para análise.

    Em muitos cenários analíticos, o uso de configurações padrão para uma relação fornece todos os dados necessários para análise. O uso de uma relação de muitos para muitos funcionará mesmo que os dados sejam de muitos para um ou de um para um. Se você conhece a cardinalidade específica e a integridade referencial dos dados, pode ajustar as configurações Opções de desempenho(O link abre em nova janela) para descrever os dados com mais precisão e otimizar como o Tableau consulta o banco de dados.

  3. Adicione mais tabelas seguindo as mesmas etapas, conforme necessário.

    Processo de arrastar tabelas para o canvas

Depois de criar sua fonte de dados relacionada de várias tabelas, você pode mergulhar na exploração desses dados. Para obter mais informações, consulte Como funciona a análise para fontes de dados de várias tabelas que usam relações e Solucionar problemas de análise de várias tabela(O link abre em nova janela).

Observação: o conector do Salesforce não oferece suporte a operadores de desigualdade. Os conectores Google Big Query e MapR são compatíveis com junções não iguais a partir da versão 2021.4. O conector MapR está obsoleto a partir da versão 2022.3.

Mover uma tabela para criar uma relação diferente

Para mover uma tabela, arraste-a ao lado de uma tabela diferente. Passe o cursor do mouse sobre uma tabela, selecione a seta e selecione Mover.

Processo de adicionar uma tabela ao canvas e movê-la para criar uma relação com uma tabela diferente

Dica: arraste uma tabela sobre a parte superior de outra tabela para substituí-la.

Alterar a tabela raiz ou base do modelo de dados

Você pode trocar a tabela raiz (versão 2020.2 a 2024.1) ou uma tabela base (versão 2024.2 e posterior) por outra tabela downstream. Clique com o botão direito do mouse em outra tabela lógica no modelo de dados e selecione Trocar com raiz ou Trocar com tabela base (nome da tabela) para fazer a alteração.

Remover uma tabela de uma relação

Para mover uma tabela, passe o cursor do mouse sobre uma tabela, selecione a seta e selecione Remover.

Processo de remoção de uma tabela do canvas

Excluir uma tabela na tela exclui também automaticamente seus descendentes relacionados.

Exibir uma relação

  • Passe o cursor do mouse sobre a linha de relação (noodle) para ver os campos correspondentes que a definem. Você também pode passar o cursor do mouse sobre qualquer tabela lógica para ver o que ela contém.

    processo de passar o cursor mouse sobre uma tabela para mostrar como as tabelas estão relacionadas entre si

Editar uma relação

  • Selecionar uma linha de relação para abrir as configurações de relação no painel Detalhes da tabela. É possível adicionar, alterar ou remover os campos usados para definir a relação. Adicione mais pares de campo para criar uma relação composta.
  • Para adicionar vários pares de campos: depois de selecionar o primeiro par, selecione Fechar e, depois, selecione Adicionar mais campos.

    Processo de edição de relacionamento padrão com outro diferente

Dicas sobre como criar relações

  • A primeira tabela que você arrasta para a tela torna-se a tabela raiz ou base para o modelo de dados na fonte de dados. Depois de arrastar a tabela base, você pode arrastar mais tabelas em qualquer ordem. Será necessário considerar quais tabelas devem estar relacionadas entre si e os pares de campo correspondentes que você define para cada relação.
  • Antes de começar a criar relações, a visualização dos dados da fonte de dados antes ou durante a análise pode ser útil para dar uma noção do escopo de cada tabela. Para obter mais informações, consulte Visualizar dados subjacentes. Você também pode usar Exibir dados para ver os dados subjacentes de uma tabela quando uma relação é inválida.
  • Se você estiver trabalhando com dados em um esquema em estrela, pode ser útil arrastar a tabela de fatos primeiro para torná-la a tabela base e, em seguida, relacionar as tabelas de dimensões a essa tabela base.
  • Cada relação deve conter pelo menos um par de campos correspondentes. Adicione vários pares de campo para criar uma relação composta. Os pares correspondentes devem ter o mesmo tipo de dados no banco de dados subjacente. Alterar o tipo de dados na página Fonte de dados não altera esse requisito. O Tableau ainda usará o tipo de dados no banco de dados para consultas.
  • Elas não podem ser baseadas em campos calculados. Você também pode especificar como os campos devem ser comparados com operadores, quando você define a relação.
  • Excluir uma tabela na tela exclui também automaticamente seus descendentes relacionados.
  • Você pode trocar a tabela raiz (versão 2020.2 a 2024.1) ou uma tabela base (versão 2024.2 e posterior) por outra tabela downstream. Clique com o botão direito do mouse em outra tabela lógica no modelo de dados e selecione Trocar com raiz ou Trocar com tabela base (nome da tabela) para fazer a alteração.

Validar relações na fonte de dados

Você tem várias opções para validar o modelo de dados para análise. À medida que você cria o modelo para a fonte de dados, recomendamos acessar a planilha, selecionar essa fonte de dados e criar uma visualização, para explorar contagens de registros, valores sem correspondência, nulos ou valores de medida repetidos. Tente trabalhar com campos em diferentes tabelas para garantir que tudo fique como você espera.

O que você deve analisar:

  • Suas relações estão no modelo de dados que usa os campos de correspondência corretos para as tabelas?
  • Quais são os resultados de arrastar diferentes dimensões e medidas para a exibição?
  • Você está vendo o número esperado de linhas?
  • Relações compostas tornariam a relação mais precisa?
  • Se algumas configurações de Opções de desempenho foram alteradas nas configurações padrão, os valores na visualização são os esperados? Caso contrário, verifique as configurações ou redefina para o padrão.

Opções para validar as relações e o modelo de dados:

  • Cada tabela inclui uma contagem de registros, como um campo chamado TableName(Count) no nível de detalhe para essa tabela. Para ver a contagem de uma tabela, arraste o campo Contagem para a exibição. Para ver a contagem de todas as tabelas, selecione o campo Contagem de cada tabela no painel Dados e clique na Tabela de texto em Mostre-me.
  • Clique em Exibir dados no painel Dados para ver o número de linhas e dados por tabela. Além disso, antes de começar a criar relações, a visualização dos dados da fonte de dados antes ou durante a análise pode ser útil para dar uma noção do escopo de cada tabela. Para obter mais informações, consulte Exibir dados subjacentes(O link abre em nova janela).
  • Arraste as dimensões para as linhas para ver o Número de linhas na barra de status. Para ver os valores sem correspondência, clique no menu Análise e selecione Layout da tabela > Mostrar linhas vazias ou Mostrar colunas vazias. Você também pode arrastar diferentes medidas para a exibição, como <YourTable>(Count) de uma das tabelas representadas na visualização. Isso garante que você verá todos os valores das dimensões nessa tabela.

Dica: se você quiser ver as consultas que estão sendo geradas para relações, poderá usar o Registrador de desempenho no Tableau Desktop.

  1. Clique no menu Ajuda e selecione Configurações e desempenho > Iniciar registro de desempenho.
  2. Arraste campos para a exibição para criar a visualização.
  3. Clique no menu Ajuda e selecione Configurações e desempenho > Parar registro de desempenho.
  4. No painel Resumo de desempenho, em Eventos classificados por tempo, clique na barra “Execução de consulta” e visualize a consulta abaixo.

Outra opção mais avançada é usar o Tableau Log Viewer(O link abre em nova janela) no GitHub. Filtre uma palavra-chave específica usando end-protocol.query. Para obter mais informações, comece com a página wiki do Tableau Log Viewer(O link abre em nova janela) no GitHub.

Visualizações somente de dimensões

Ao usar uma fonte de dados de várias tabelas com tabelas relacionadas: se você criar uma visualização somente de dimensões, o Tableau usará as uniões de colunas internas e você não verá o domínio sem correspondência completo.

Para ver combinações parciais dos valores de dimensão, é possível:

  • Usar Mostrar linhas/colunas vazias para ver todas as linhas possíveis. Clicar no menu Análise e selecionar Layout da tabela > Mostrar linhas vazias ou Mostrar colunas vazias.
  • Adicionar uma medida à exibição, como <YourTable>(Count) de uma das tabelas representadas na visualização. Isso garante que você verá todos os valores das dimensões nessa tabela.

Para obter mais informações, consulte Análise em fontes de dados de várias tabelas versus tabela única(O link abre em nova janela) e Solucionar problemas de análise de várias tabelas(O link abre em nova janela).

Relações (tabelas lógicas) versus uniões de colunas (tabelas físicas)

Embora semelhantes, as uniões de colunas e relações se comportam de forma diferente no Tableau, e são definidas em diferentes camadas do modelo de dados(O link abre em nova janela). Você cria relações entre tabelas lógicas na camada lógica de nível superior da fonte de dados. Você cria uniões de colunas entre tabelas físicas na camada física da fonte de dados.

As uniões de colunas mesclam os dados de duas tabelas em uma única tabela, antes do início da análise. A mesclagem das tabelas pode fazer com que os dados sejam duplicados ou filtrados de uma ou ambas as tabelas. Também pode fazer com que linhas NULAS sejam adicionadas aos dados, se você utilizar uma união de colunas externa à esquerda, à direita ou completa. Ao analisar dados unidos, você precisa garantir que pode lidar corretamente com os efeitos da união de colunas nos dados.

Observação: quando a duplicação ou os efeitos de filtragem de uma união podem ser desejáveis, use as uniões para mesclar tabelas em vez de relacionamentos. Clique duas vezes em uma tabela lógica para abrir a camada física e adicionar tabelas com uniões de colunas.

Uma relação descreve como duas tabelas independentes estão relacionadas entre si, mas não mescla as tabelas. Isso evita a duplicação de dados e os problemas de filtragem que podem ocorrer em uma união de colunas e pode facilitar o trabalho com os dados.

relaçõesuniões de colunas
Definidas entre tabelas lógicas na tela Relação (camada lógica)Definidas entre tabelas físicas na tela União de colunas/União de linhas (camada física)
Não exigem que você defina um tipo de união de colunasExigem planejamento da união de colunas e tipo de união
Atuam como contêineres para tabelas com união de colunas ou de linhasSão mescladas na tabela lógica
Somente dados relevantes para a visualização são consultados. As configurações de cardinalidade e integridade referencial podem ser ajustadas para otimizar as consultas.Executadas como parte de cada consulta
O nível de detalhe está no agregado para a visualizaçãoO nível de detalhe está no nível da linha para a tabela única
Os tipos de união são formados automaticamente pelo Tableau com base no contexto da análise. O Tableau determina as uniões de colunas necessárias com base nas medidas e nas dimensões da visualização.Os tipos de união são estáticos e fixos na fonte de dados, independentemente do contexto da análise. As uniões de colunas e de linhas são estabelecidas antes da análise e não mudam.
As linhas não são duplicadasOs dados da tabela mesclada podem resultar em duplicação
Os registros sem correspondência são incluídos nos agregados, a menos que sejam explicitamente excluídosOs registros sem correspondência são omitidos dos dados mesclados
Criam domínios independentes em vários níveis de detalheCenários de suporte que exigem uma única tabela de dados, como filtros de extração e agregação

Relações versus combinações

Embora tanto as relações quanto as combinações aceitem a análise em diferentes níveis de detalhe, elas têm diferenças. Um dos motivos pelos quais você pode usar combinações em vez de relações é combinar fontes de dados publicadas para a análise.

relaçõescombinações
Definidas na fonte de dadosDefinidas na planilha entre as fontes de dados principal e secundária
Podem ser publicadasNão podem ser publicadas
Todas as tabelas são iguais semanticamenteDependem da seleção de fontes de dados principal e secundárias e de como essas fontes de dados são estruturadas.
Aceitam uniões de colunas externas completasAceitam apenas uniões de colunas à esquerda
Calculadas localmenteCalculadas como parte da consulta SQL
Os campos relacionados são fixosOs campos relacionados variam por planilha (podem ser personalizados planilha a planilha)

Recursos de diferentes opções para combinar dados: relações, uniões de colunas e combinações

Há muitas maneiras de combinar tabelas de dados, cada uma com seus próprios cenários e nuances preferidos.

Relacionar

Use ao combinar dados de diferentes níveis de detalhe.

  • Requer campos correspondentes entre duas tabelas lógicas. Vários pares de campos correspondentes podem definir a relação.
  • Utiliza automaticamente agregações corretas e uniões de colunas contextuais com base em como os campos são relacionados e usados na visualização.
  • Aceita muitos para muitos e uniões de colunas externas.
  • As relações são consistentes em toda a pasta de trabalho e podem ser publicadas.
  • Pode ser publicado, mas não é possível combinar fontes de dados publicadas usando relacionamentos.
  • Não é possível definir relações com base em campos geográficos.
  • O uso de filtros de fonte de dados limita os benefícios da separação de união das relações.
União de colunas

Use quando quiser adicionar mais colunas de dados na mesma estrutura de linha.

  • Requer campos comuns entre duas tabelas físicas.
  • Requer a criação de uma cláusula de união e um tipo de união.
  • As tabelas físicas com união de colunas são mescladas em uma única tabela lógica, com uma combinação fixa de dados.
  • Pode causar perda de dados caso os campos ou os valores não estejam presentes em todas as tabelas (dependendo dos tipos usados de uniões de colunas).
  • Pode causar a duplicação de dados se os campos estiverem em diferentes níveis de detalhe.
  • Pode usar filtros de fonte de dados.
União de linhas

Use quando quiser adicionar mais linha de dados com a mesma estrutura de coluna.

  • Com base nas colunas correspondentes entre duas tabelas.
  • As tabelas físicas com união de linhas são mescladas em uma única tabela lógica, com uma combinação fixa de dados.
Combinação

Use ao combinar dados de diferentes níveis de detalhe.

  • Pode ser usada para combinar fontes de dados publicadas, mas não pode ser publicada.
  • Pode ser usada entre uma fonte de dados relacional e uma fonte de dados de cubo.
  • As fontes de dados podem ser mescladas por planilha.
  • Sempre unem colunas à esquerda eficazmente (podem perder dados das fontes de dados secundárias).
Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!