O modelo de dados do Tableau

Todas as fontes de dados criadas no Tableau têm um modelo de dados. Você pode pensar em um modelo de dados como um diagrama que informa ao Tableau como ele deve consultar dados nas tabelas de banco de dados conectadas.

Na página Fontes de dados, as tabelas adicionadas à tela criam a estrutura do modelo de dados. Um modelo de dados pode ser simples, como uma única tabela. Ou pode ser mais complexo, com várias tabelas que usam diferentes combinações de relações, uniões de colunas e uniões de linhas.

O modelo de dados tem duas camadas:

  • A exibição padrão que você visualiza na tela da página Fonte de dados é a camada lógica da fonte de dados. Combine dados na camada lógica usando relações (ou noodles). Pense nessa camada como a tela Relações na página Fontes de dados. Para obter mais informações, consulte Usar relações para análise de dados de várias tabelas.
  • A próxima camada é a camada física. Combine dados entre as tabelas na camada física usando uniões de colunas e uniões de linhas. Cada tabela lógica contém pelo menos uma tabela física nessa camada. Pense na camada física como a tela União de colunas/União de linhas na página Fonte de dados. Clique duas vezes em uma tabela lógica para exibir ou adicionar uniões de colunas e de linhas.

Camada lógica   Camada física
Noodles = Relações   Diagrama de Venn = União de colunas
 
A exibição de nível superior de uma fonte de dados com várias tabelas relacionadas. Esta é a camada lógica. As tabelas lógicas podem ser combinadas usando relações (noodles). Elas não usam tipos de união. Elas atuam como contêineres de tabelas físicas.   Clique duas vezes em uma tabela lógica para abri-la e ver as tabelas físicas. As tabelas físicas podem ser combinadas usando uniões de colunas e de linhas. Neste exemplo, a tabela lógica Livro consiste em três tabelas físicas com união de colunas (Livro, Prêmio, Informação).

 

Camada lógica   Camada física
Tela Relações na página Fonte de dados   Tela União de colunas/União de linhas na página Fonte de dados
As tabelas que você arrasta aqui são as tabelas lógicas   As tabelas que você arrasta aqui são as tabelas físicas
As tabelas lógicas podem estar relacionadas a outras tabelas lógicas   As tabelas físicas podem unir colunas ou linhas de outras tabelas físicas
As tabelas lógicas são semelhantes a contêineres de tabelas físicas   Clique duas vezes em uma tabela lógica para ver as tabelas físicas
O nível de detalhe está no nível de linha da tabela lógica   O nível de detalhe está no nível de linha das tabelas físicas mescladas
As tabelas lógicas permanecem distintas (normalizadas), não mescladas na fonte de dados   As tabelas físicas são mescladas em uma única tabela simples que define a tabela lógica

Camadas do modelo de dados

A exibição de nível superior que você vê de uma fonte de dados é a camada lógica do modelo de dados. Você também pode pensar nisso como a tela Relações, pois as tabelas são combinadas usando relações, em vez de união de colunas.

Quando você combina dados de várias tabelas, cada tabela que você arrasta para a tela na camada lógica deve ter uma relação com outra tabela. Não é necessário especificar os tipos de união de colunas para relações. Durante a análise, o Tableau seleciona automaticamente os tipos de união de colunas apropriados, com base nos campos e no contexto da análise na planilha.

A camada física do modelo de dados é o local onde você pode combinar dados usando uniões de colunas e de linhas. Você só pode usar tabelas dinâmicas nesta tela. Você pode pensar nisso como a tela União de colunas/União de linhas. Nas versões anteriores do Tableau, a camada física era a única camada no modelo de dados. Cada tabela lógica pode conter uma ou mais tabelas físicas.

Importante: você ainda pode criar fontes de dados de tabela única no Tableau que usam uniões de colunas e de linhas. O comportamento da análise de tabela única no Tableau não mudou. As pastas de trabalho atualizadas funcionarão da mesma forma que antes de 2020.2.

Noções básicas do modelo de dados

Nas versões anteriores do Tableau, o modelo de dados tinha apenas a camada física. No Tableau 2020.2 e posterior, o modelo de dados tem a camada lógica (semântica) e uma camada física. Isso oferece mais opções para combinar dados usando esquemas para se adequar à análise.

No Tableau 2020.2 e posterior, uma camada lógica foi adicionada à fonte de dados. Cada tabela lógica contém tabelas físicas em uma camada física.

Nas versões anteriores do Tableau, o modelo de dados na fonte de dados consistia em uma única camada física, em que era possível especificar as uniões de colunas e de linhas. As tabelas adicionadas à camada física (com uniões de colunas ou de linhas) criam uma única tabela achatada (desnormalizada) para análise.

Versões anteriores   2020.2 e posteriores
 
Nas versões do Tableau anteriores a 2020,2, o modelo de dados tem apenas a camada física   No 2020.2 e posteriores, o modelo de dados tem duas camadas: a camada lógica e a camada física

No Tableau 2020.2, o modelo de dados na fonte de dados inclui uma nova camada semântica acima da camada física, chamada de camada lógica, onde várias tabelas podem ser adicionadas e relacionadas entre si. As tabelas na camada lógica não são mescladas na fonte de dados, permanecem distintas (normalizadas) e mantêm o nível de detalhe nativo.

As tabelas lógicas atuam como contêineres para tabelas físicas mescladas. Uma tabela lógica pode conter uma única tabela física. Ou pode conter várias tabelas físicas mescladas por meio de uniões de colunas e de linhas.

Criar um novo modelo

Quando você adiciona uma ou mais tabelas à camada lógica, está criando essencialmente o modelo de dados para sua fonte de dados. É possível criar uma fonte de dados de uma única tabela lógica ou você pode arrastar várias tabelas para a tela para criar um modelo mais complexo.

  • A primeira tabela que você arrasta para a tela torna-se a tabela raiz para o modelo de dados na fonte de dados.
  • Depois de arrastar a tabela raiz, você pode arrastar tabelas adicionais em qualquer ordem. Você precisará considerar quais tabelas devem estar relacionadas entre si e os pares de campo correspondentes que você define para cada relação.
  • Caso você esteja criando um esquema de estrela, pode ser útil arrastar a tabela de fatos primeiro e, em seguida, relacionar tabelas de dimensão com essa tabela.
  • Excluir uma tabela na tela exclui também automaticamente seus descendentes relacionados. Se você excluir a tabela raiz, todas as outras tabelas do modelo também serão removidas.
  • Cada relação deve conter pelo menos um par de campos correspondentes. Adicione vários pares de campo para criar uma relação composta. Os pares correspondentes devem ter o mesmo tipo de dados. Alterar o tipo de dados na página Fonte de dados não altera esse requisito. O Tableau ainda usará o tipo de dados no banco de dados subjacente para consultas.
  • Elas não podem ser baseadas em campos calculados.
  • Você pode especificar como os campos usados nas relações devem ser comparados usando operadores ao definir a relação.

Observação: não é possível editar o modelo de dados em uma fonte de dados publicada.

Para obter mais informações sobre relações, consulte Criar e definir relações em Relacionar os dados.

Modelo de várias tabelas

  • Para criar um modelo de várias tabelas, arraste tabelas para a camada lógica da tela da página Fonte de dados.


As tabelas arrastadas para a camada lógica da tela da página Fonte de dados devem estar relacionadas entre si. Quando você arrasta tabelas adicionais para a tela de camada lógica, o Tableau tenta criar automaticamente a relação com base nas restrições de chave existentes e nos campos correspondentes para definir a relação. Se não puder determinar os campos correspondentes, selecione-os.

Se nenhuma restrição for detectada, uma relação Muitos para muitos será criada e a integridade referencial será definida como Alguns registros correspondem. Essas configurações padrão são uma escolha segura e fornecem o máximo de flexibilidade para sua fonte de dados. As configurações padrão aceitam uniões de colunas externas completas e otimizam as consultas agregando dados de tabela antes de formar as uniões de colunas durante a análise. Todos os dados de coluna e de linha em cada tabela se tornam disponíveis para análise.

É possível adicionar mais dados à qualquer tabela lógica clicando duas vezes na tabela. Isso abre a camada física da tela da página Fonte de dados. Se você precisar usar uniões de colunas e de linhas, arraste as tabelas em que deseja fazer essas uniões para a tela de camada física. As tabelas físicas são mescladas na tabela lógica.

Siga as etapas em Criar e definir relações para combinar várias tabelas.

Modelo de tabela única

  • Para criar um modelo de tabela única, arraste uma tabela para a tela de camada lógica da página Fonte de dados. Em seguida, use os campos dessa tabela no painel Dados para análise.

Modelo de tabela única que contém outras tabelas

É possível adicionar mais dados em uma única tabela lógica clicando duas vezes na tabela. Isso abre a camada física da tela da página Fonte de dados. Se você precisar usar uniões de colunas e de linhas, arraste as tabelas em que deseja fazer essas uniões para a tela de camada física. As tabelas físicas são mescladas na tabela lógica.

Este exemplo mostra a tabela Livro na tela Relações (camada lógica) da fonte de dados. Clicar duas vezes na tabela lógica Livro abre a tela União de colunas/União de linhas (camada física).

Neste exemplo, as uniões de colunas mesclam as tabelas Prêmio e Informação com a tabela Livro. Nesse caso, a união de colunas entre Livro e Prêmio será de um a muitos, no nível de detalhe de prêmios. Isso duplicaria os valores de medida de Livro e Informação. Para evitar a duplicação, relacione Prêmio e Informação a Livro em vez de unir colunas na tabela lógica Livro.

Esquemas de modelo de dados compatíveis

Os recursos de modelagem de dados introduzidos no Tableau na versão 2020.2 foram criados para facilitar a análise dos cenários comuns de dados de várias tabelas, incluindo modelos de dados estrela e floco de neve. Os seguintes tipos de modelos são aceitos em fontes de dados do Tableau.

Tabela única

A análise sobre uma única tabela lógica que contém uma mistura de dimensões e medidas funciona exatamente como no Tableau anterior à versão 2020.2. É possível criar uma tabela lógica usando uma combinação de uniões de colunas, uniões de linhas, SQL personalizado etc.

Estrela e floco de neve

Nos data warehouses corporativos, é comum ter dados estruturados em esquemas estrela ou floco de neve, onde as medidas estão em uma tabela de fatos central e as dimensões são armazenadas separadamente, em tabelas de dimensão independentes. Essa organização de dados é compatível com muitos fluxos de análise comuns, incluindo roll-up e drill-down.

Esses modelos podem ser representados diretamente com relações nos recursos de modelagem de dados disponíveis a partir do Tableau 2020.2.

Arraste a tabela de fatos para o modelo e, depois, relacione as tabelas de dimensão à tabela de fatos (em um esquema estrela) ou a outras tabelas de dimensão (em um floco de neve).

Normalmente, em um esquema estrela ou floco de neve com modelagem adequada, as relações entre a tabela de fatos e as tabelas de dimensão são de muitos para um. Se essas informações forem codificadas no data warehouse, o Tableau usará isso automaticamente para definir as opções de desempenho da relação. Caso contrário, você mesmo pode definir essas informações. Para obter mais informações, consulte Otimizar consultas de relações usando opções de desempenho.

Em um esquema estrela ou floco de neve com modelagem adequada, cada linha na tabela de fatos terá uma entrada correspondente em cada uma das tabelas de dimensão. Se isso for verdadeiro e capturado nas restrições de integridade do data warehouse, o Tableau usará automaticamente essas informações para definir a configuração de integridade referencial em Opções de desempenho. Se algumas linhas da tabela de fatos não tiverem uma linha correspondente em uma tabela de dimensão (às vezes denominada “dimensões de chegada tardia” ou “fatos de chegada antecipada”), o Tableau assumirá o padrão de manter todas as linhas ao calcular medidas, mas poderá diminuir os valores ao mostrar cabeçalhos de dimensão. Para obter mais informações, consulte Otimizar consultas de relações usando opções de desempenho.

Estrela e floco de neve com medidas em mais de uma tabela

Em alguns esquemas estrela ou floco de neve, todas as medidas para a análise estão na tabela de fatos. No entanto, muitas vezes é verdade que medidas adicionais de interesse podem estar relacionadas às tabelas de dimensão na análise. Mesmo que as tabelas de dimensão não contenham medidas, é comum na análise querer contar ou agregar valores de dimensão. Nesses casos, a distinção entre tabelas de fatos e tabelas de dimensão é menos óbvia. Para criar clareza ao visualizar seu modelo de dados, recomendamos adicionar a tabela mais refinada à tela de fonte de dados e, depois, relacionar todas as outras tabelas à primeira tabela.

Se você juntar essas tabelas em uma única tabela lógica, as medidas nas tabelas de dimensão seriam replicadas, resultando em agregados distorcidos, a menos que você tomasse precauções para deduplicar os valores usando cálculos de LOD ou COUNT DISTINCT. No entanto, se você criar relações entre essas tabelas, o Tableau agregará medidas antes de realizar as uniões de colunas, evitando o problema da duplicação desnecessária. Isso dispensa a necessidade de acompanhar cuidadosamente o nível de detalhe das medidas.

Análise de vários fatores

Os recursos de modelagem de dados do Tableau são compatíveis com algumas formas de análise de vários fatores. Tabelas de fatos adicionais (contendo medidas) podem ser adicionadas a qualquer um dos modelos mencionados anteriormente, desde que se relacionem apenas com uma tabela de dimensão única. Por exemplo, é possível reunir duas ou mais tabelas de fatos para analisar uma dimensão compartilhada, como em análises semelhantes ao Cliente 360. Essas tabelas de fatos podem estar em um nível de detalhe diferente da tabela de dimensão, ou uma da outra. Também podem ter uma relação de muitos para muitos com a tabela de dimensão. Nesses cenários, o Tableau vai garantir que os valores não sejam replicados antes da agregação.

Se você não possui uma tabela de dimensão compartilhada que relacione as tabelas de fatos, às vezes, é possível criar uma dinamicamente, usando o SQL personalizado ou usando uniões de colunas ou de linhas de outras tabelas de dimensão.

Duas tabelas de fatos podem ser relacionadas diretamente uma à outra em uma dimensão comum. Esse tipo de análise funciona melhor quando uma das tabelas de fatos contém um superconjunto da dimensão comum.

Modelos incompatíveis

  • Várias tabelas de fatos relacionadas a várias tabelas de dimensão compartilhadas. Em alguns casos de uso, é comum ter várias tabelas de fatos relacionadas a várias tabelas de dimensão compartilhadas. Por exemplo, você pode ter duas tabelas de fatos, Vendas na loja e Vendas pela Internet, relacionadas a duas tabelas de dimensão comum, Data e Cliente. Normalmente, esses cenários exigiriam criar uma relação circular em seu modelo de dados. As relações circulares não são compatíveis na versão 2020.2.

    Você pode aproximar este tipo de modelo mesclando algumas das tabelas na camada física. Por exemplo, é possível unir as linhas de Vendas na loja e Vendas pela Internet em uma única tabela, que pode então ser relacionada à Data e ao Cliente. Como alternativa, é possível fazer a união cruzada de Data e Cliente para criar uma única tabela de dimensão que pode ser relacionada a Vendas na loja e Vendas pela Internet.

  • Como relacionar diretamente 3 ou mais tabelas de fatos em dimensões compartilhadas. Embora seja possível criar este modelo na camada lógica, você pode ver resultados indesejados, a menos que use apenas dimensões de uma única tabela.

Requisitos para relações em um modelo de dados

  • Ao relacionar tabelas, os campos que definem as relações devem ter o mesmo tipo de dados. Alterar o tipo de dados na página Fonte de dados não altera esse requisito. O Tableau ainda usará o tipo de dados no banco de dados subjacente para consultas.
  • Não é possível definir relações com base em campos geográficos.
  • Relações circulares não são aceitos no modelo de dados.
  • Não é possível editar relações em uma fonte de dados publicada.
  • Não é possível definir relações entre fontes de dados publicadas.
  • Sua pasta de trabalho deve usar uma fonte de dados incorporada para que você possa editar relações e opções de desempenho na página Fonte de dados no Tableau Online ou no Tableau Server.

Fatores que limitam os benefícios do uso de tabelas relacionadas

  • Dados sujos em tabelas (ou seja, tabelas que não foram criadas com um modelo bem estruturado em mente e contêm uma mistura de medidas e dimensões em várias tabelas) podem tornar a análise de várias tabelas mais complexa.
  • O uso de filtros da fonte de dados limitará a capacidade de o Tableau fazer a separação de união nos dados. A separação de união é um termo que se refere ao modo como o Tableau simplifica as consultas, removendo uniões de colunas desnecessárias.
  • Tabelas com muitos valores sem correspondência entre relações.
  • Interrelacionar várias tabelas de fatos com várias tabelas de dimensão (tentando modelar dimensões compartilhadas ou em conformidade).
Agradecemos seu feedback!