O modelo de dados do Tableau
Todas as fontes de dados criadas no Tableau têm um modelo de dados. Você pode pensar em um modelo de dados como um diagrama que informa ao Tableau como ele deve consultar dados nas tabelas de banco de dados conectadas.
Na página Fontes de dados, as tabelas adicionadas à tela criam a estrutura do modelo de dados. Um modelo de dados pode ser simples, como uma única tabela. Ou pode ser mais complexo, com várias tabelas que usam diferentes combinações de relações, uniões de colunas e uniões de linhas.
O modelo de dados tem duas camadas:
- A exibição padrão que você visualiza na tela da página Fonte de dados é a camada lógica da fonte de dados. Combine dados na camada lógica usando relações (ou noodles). Pense nessa camada como a tela Relações na página Fontes de dados. Para obter mais informações, consulte Usar relações para análise de dados de várias tabelas(O link abre em nova janela).
- A próxima camada é a camada física. Combine dados entre as tabelas na camada física usando uniões de colunas(O link abre em nova janela) e uniões de linhas. Cada tabela lógica contém pelo menos uma tabela física nessa camada. Pense na camada física como a tela União de colunas/União de linhas na página Fonte de dados. Clique duas vezes em uma tabela lógica para exibir ou adicionar uniões de colunas e de linhas.
Camada lógica | Camada física | |
---|---|---|
Noodles = Relações | Diagrama de Venn = União de colunas | |
A exibição de nível superior de uma fonte de dados com várias tabelas relacionadas. Esta é a camada lógica. As tabelas lógicas podem ser combinadas usando relações (noodles). Elas não usam tipos de união. Elas atuam como contêineres de tabelas físicas. | Clique duas vezes em uma tabela lógica para abri-la e ver as tabelas físicas. As tabelas físicas podem ser combinadas usando uniões de colunas e de linhas. Neste exemplo, a tabela lógica Livro consiste em três tabelas físicas com união de colunas (Livro, Prêmio, Informação). |
Camada lógica | Camada física | |
---|---|---|
Tela Relações na página Fonte de dados | Tela União de colunas/União de linhas na página Fonte de dados | |
As tabelas que você arrasta aqui são as tabelas lógicas | As tabelas que você arrasta aqui são as tabelas físicas | |
As tabelas lógicas podem estar relacionadas a outras tabelas lógicas | As tabelas físicas podem unir colunas ou linhas de outras tabelas físicas | |
As tabelas lógicas são semelhantes a contêineres de tabelas físicas | Clique duas vezes em uma tabela lógica para ver as tabelas físicas | |
O nível de detalhe está no nível de linha da tabela lógica | O nível de detalhe está no nível de linha das tabelas físicas mescladas | |
As tabelas lógicas permanecem distintas (normalizadas), não mescladas na fonte de dados | As tabelas físicas são mescladas em uma única tabela simples que define a tabela lógica |
Camadas do modelo de dados
A exibição de nível superior que você vê de uma fonte de dados é a camada lógica do modelo de dados. Você também pode pensar nisso como a tela Relações, pois as tabelas são combinadas usando relações, em vez de união de colunas.
Quando você combina dados de várias tabelas, cada tabela que você arrasta para a tela na camada lógica deve ter uma relação com outra tabela. Não é necessário especificar os tipos de união de colunas para relações. Durante a análise, o Tableau seleciona automaticamente os tipos de união de colunas apropriados, com base nos campos e no contexto da análise na planilha.
A camada física do modelo de dados é o local onde você pode combinar dados usando uniões de colunas e de linhas. Você só pode usar tabelas dinâmicas nesta tela. Você pode pensar nisso como a tela União de colunas/União de linhas. Nas versões anteriores do Tableau, a camada física era a única camada no modelo de dados. Cada tabela lógica pode conter uma ou mais tabelas físicas.
Importante: você ainda pode criar fontes de dados de tabela única no Tableau que usam uniões de colunas e de linhas. O comportamento da análise de tabela única no Tableau não mudou. As pastas de trabalho atualizadas funcionarão da mesma forma que antes de 2020.2.
Saiba mais: para obter informações relacionadas sobre a combinação de dados usando relações, consulte também esses tópicos e publicações no blog:
- Como as relações diferem das uniões de colunas
- Usar relações para análise de dados de várias tabelas
- Relacionar os dados
- Relações, parte 1: apresentação da nova modelagem de dados no Tableau(O link abre em nova janela)
- Relações, parte 2: dicas e truques(O link abre em nova janela)
- Relações, parte 3: fazer perguntas em várias tabelas relacionadas(O link abre em nova janela)
Veja também podcasts de vídeo sobre relacionamentos em Análises de ação(O link abre em nova janela), como Por que o Tableau inventou os relacionamentos?(O link abre em nova janela) Clique em "Podcast de vídeo" na Biblioteca(O link abre em nova janela) para ver mais.
Noções básicas do modelo de dados
Nas versões anteriores do Tableau (anteriores a 2020.2), o modelo de dados tinha apenas uma camada física. No Tableau 2020.2 e posterior, o modelo de dados tem a camada lógica (semântica) e uma camada física. Isso oferece mais opções para combinar dados usando esquemas para se adequar à análise.
Nas versões anteriores do Tableau (antes de 2020.2), o modelo de dados na fonte de dados consistia em uma única camada física, em que era possível especificar as uniões de colunas e de linhas. As tabelas adicionadas à camada física (com uniões de colunas ou de linhas) criam uma única tabela achatada (desnormalizada) para análise.
Versões anteriores | 2020.2 e posteriores | |
---|---|---|
No Tableau 2020.2 e posterior, o modelo de dados na fonte de dados inclui uma nova camada semântica acima da camada física, chamada de camada lógica, onde várias tabelas podem ser adicionadas e relacionadas entre si. As tabelas na camada lógica não são mescladas na fonte de dados, permanecem distintas (normalizadas) e mantêm o nível de detalhe nativo.
As tabelas lógicas atuam como contêineres para tabelas físicas mescladas. Uma tabela lógica pode conter uma única tabela física. Ou pode conter várias tabelas físicas mescladas por meio de uniões de colunas e de linhas.
Criar um novo modelo
Quando você adiciona uma ou mais tabelas à camada lógica, está criando essencialmente o modelo de dados para sua fonte de dados. É possível criar uma fonte de dados de uma única tabela lógica ou você pode arrastar várias tabelas para a tela para criar um modelo mais complexo.
- A primeira tabela que você arrasta para a tela torna-se a tabela raiz para o modelo de dados na fonte de dados.
- Depois de arrastar a tabela raiz, você pode arrastar tabelas adicionais em qualquer ordem. Você precisará considerar quais tabelas devem estar relacionadas entre si e os pares de campo correspondentes que você define para cada relação.
- Caso você esteja criando um esquema de estrela, pode ser útil arrastar a tabela de fatos primeiro e, em seguida, relacionar tabelas de dimensão com essa tabela.
- Excluir uma tabela na tela exclui também automaticamente seus descendentes relacionados. Se você excluir a tabela raiz, todas as outras tabelas do modelo também serão removidas.
- Cada relação deve conter pelo menos um par de campos correspondentes. Adicione vários pares de campo para criar uma relação composta. Os pares correspondentes devem ter o mesmo tipo de dados. Alterar o tipo de dados na página Fonte de dados não altera esse requisito. O Tableau ainda usará o tipo de dados no banco de dados subjacente para consultas.
- Elas não podem ser baseadas em campos calculados.
- Você pode especificar como os campos usados nas relações devem ser comparados usando operadores ao definir a relação.
Para obter mais informações sobre relações, consulte Criar e definir relações em Relacionar os dados.
Modelo de várias tabelas
- Para criar um modelo de várias tabelas, arraste tabelas para a camada lógica da tela da página Fonte de dados.
As tabelas arrastadas para a camada lógica da tela da página Fonte de dados devem estar relacionadas entre si. Quando você arrasta tabelas adicionais para a tela de camada lógica, o Tableau tenta criar automaticamente a relação com base nas restrições de chave existentes e nos campos correspondentes para definir a relação. Se não puder determinar os campos correspondentes, selecione-os.
Se nenhuma restrição for detectada, uma relação Muitos para muitos será criada e a integridade referencial será definida como Alguns registros correspondem. Essas configurações padrão são uma escolha segura e fornecem o máximo de flexibilidade para sua fonte de dados. As configurações padrão aceitam uniões de colunas externas completas e otimizam as consultas agregando dados de tabela antes de formar as uniões de colunas durante a análise. Todos os dados de coluna e de linha em cada tabela se tornam disponíveis para análise.
É possível adicionar mais dados à qualquer tabela lógica clicando duas vezes na tabela. Isso abre a camada física da tela da página Fonte de dados. Se você precisar usar uniões de colunas e de linhas, arraste as tabelas em que deseja fazer essas uniões para a tela de camada física. As tabelas físicas são mescladas na tabela lógica.
Siga as etapas em Criar e definir relações para combinar várias tabelas.
Modelo de tabela única
- Para criar um modelo de tabela única, arraste uma tabela para a tela de camada lógica da página Fonte de dados. Em seguida, use os campos dessa tabela no painel Dados para análise.
Modelo de tabela única que contém outras tabelas
É possível adicionar mais dados em uma única tabela lógica clicando duas vezes na tabela. Isso abre a camada física da tela da página Fonte de dados. Se você precisar usar uniões de colunas e de linhas, arraste as tabelas em que deseja fazer essas uniões para a tela de camada física. As tabelas físicas são mescladas na tabela lógica.
Este exemplo mostra a tabela Livro na tela Relações (camada lógica) da fonte de dados. Clicar duas vezes na tabela lógica Livro abre a tela União de colunas/União de linhas (camada física).
Neste exemplo, as uniões de colunas mesclam as tabelas Prêmio e Informação com a tabela Livro. Nesse caso, a união de colunas entre Livro e Prêmio será de um a muitos, no nível de detalhe de prêmios. Isso duplicaria os valores de medida de Livro e Informação. Para evitar a duplicação, relacione Prêmio e Informação a Livro em vez de unir colunas na tabela lógica Livro.
Esquemas de modelo de dados compatíveis
Os recursos de modelagem de dados no Tableau (versão 2020.2 e posterior) foram criados para facilitar a análise dos cenários comuns de dados de várias tabelas, incluindo modelos de dados estrela e Snowflake. Os seguintes tipos de modelos são aceitos em fontes de dados do Tableau.
Tabela única
A análise sobre uma única tabela lógica que contém uma mistura de dimensões e medidas funciona exatamente como no Tableau anterior à versão 2020.2. É possível criar uma tabela lógica usando uma combinação de uniões de colunas, uniões de linhas, SQL personalizado etc.
Estrela e floco de neve
Nos data warehouses corporativos, é comum ter dados estruturados em esquemas estrela ou floco de neve, onde as medidas estão em uma tabela de fatos central e as dimensões são armazenadas separadamente, em tabelas de dimensão independentes. Essa organização de dados é compatível com muitos fluxos de análise comuns, incluindo roll-up e drill-down.
Esses modelos podem ser representados diretamente com relações nos recursos de modelagem de dados disponíveis no Tableau 2020.2 e posterior.
Arraste a tabela de fatos para o modelo e, depois, relacione as tabelas de dimensão à tabela de fatos (em um esquema estrela) ou a outras tabelas de dimensão (em um floco de neve).
Normalmente, em um esquema estrela ou floco de neve com modelagem adequada, as relações entre a tabela de fatos e as tabelas de dimensão são de muitos para um. Se essas informações forem codificadas no data warehouse, o Tableau usará isso automaticamente para definir as opções de desempenho da relação. Caso contrário, você mesmo pode definir essas informações. Para obter mais informações, consulte Otimizar consultas de relações usando opções de desempenho.
Em um esquema estrela ou floco de neve com modelagem adequada, cada linha na tabela de fatos terá uma entrada correspondente em cada uma das tabelas de dimensão. Se isso for verdadeiro e capturado nas restrições de integridade do data warehouse, o Tableau usará automaticamente essas informações para definir a configuração de integridade referencial em Opções de desempenho. Se algumas linhas da tabela de fatos não tiverem uma linha correspondente em uma tabela de dimensão (às vezes denominada “dimensões de chegada tardia” ou “fatos de chegada antecipada”), o Tableau assumirá o padrão de manter todas as linhas ao calcular medidas, mas poderá diminuir os valores ao mostrar cabeçalhos de dimensão. Para obter mais informações, consulte Otimizar consultas de relações usando opções de desempenho.
Estrela e floco de neve com medidas em mais de uma tabela
Em alguns esquemas estrela ou floco de neve, todas as medidas para a análise estão na tabela de fatos. No entanto, muitas vezes é verdade que medidas adicionais de interesse podem estar relacionadas às tabelas de dimensão na análise. Mesmo que as tabelas de dimensão não contenham medidas, é comum na análise querer contar ou agregar valores de dimensão. Nesses casos, a distinção entre tabelas de fatos e tabelas de dimensão é menos óbvia. Para criar clareza ao visualizar seu modelo de dados, recomendamos adicionar a tabela mais refinada à tela de fonte de dados e, depois, relacionar todas as outras tabelas à primeira tabela.
Se você juntar essas tabelas em uma única tabela lógica, as medidas nas tabelas de dimensão seriam replicadas, resultando em agregados distorcidos, a menos que você tomasse precauções para deduplicar os valores usando cálculos de LOD ou COUNT DISTINCT. No entanto, se você criar relações entre essas tabelas, o Tableau agregará medidas antes de realizar as uniões de colunas, evitando o problema da duplicação desnecessária. Isso dispensa a necessidade de acompanhar cuidadosamente o nível de detalhe das medidas.
Análise de vários fatos
Na versão 2024.2 e posterior, os recursos de modelagem de dados do Tableau oferecem suporte à análise de vários fatos por meio do uso de relações multifatoriais. Para obter informações detalhadas sobre como criar modelos de dados de relações multifatoriais, consulte:
Sobre modelos de dados de relação de vários fatos(O link abre em nova janela)
Quando usar um modelo de relação de vários fatos(O link abre em nova janela)
Construir um modelo de dados de relação de vários fatos(O link abre em nova janela)
Um modelo de relação de vários fatores — um modelo de dados com diversas tabelas base — permite tabelas não relacionadas no modelo quando tabelas compartilhadas também existem no modelo. Durante a análise, os campos de uma tabela compartilhada “unem” tabelas de dados que de outra forma não seriam relacionadas com base nas dimensões compartilhadas que elas têm em comum (como acontecer no mesmo local ou ao mesmo tempo). Todos os benefícios das relações são mantidos, incluindo a retenção da granulação de cada tabela, ou nível nativo de detalhe.
Semelhante a um modelo de dados de tabela base única, o Tableau determina o melhor tipo de junção a ser usado nos bastidores com base na estrutura da visualização. Mas em um modelo de relação de vários fatos, as opções de união de colunas são expandidas para incluir uniões de coluna externas e cruzadas para lidar com diferentes níveis de relação. Para mais informações, veja Sobre modelos de dados de relação de vários fatos(O link abre em nova janela).
Observação: nas versões 2020.2 a 2024.1, você poderá adicionar tabelas de fatos (contendo medidas) aos modelos estrela e floco de neve somente se eles estiverem relacionados a uma tabela de dimensão única.
Por exemplo, é possível reunir duas ou mais tabelas de fatos para analisar uma dimensão compartilhada, como em análises semelhantes ao Cliente 360. Essas tabelas de fatos podem estar em um nível de detalhe diferente da tabela de dimensão, ou uma da outra. Também podem ter uma relação de muitos para muitos com a tabela de dimensão. Nesses cenários, o Tableau vai garantir que os valores não sejam replicados antes da agregação.
Se você não possui uma tabela de dimensão compartilhada que relacione as tabelas de fatos, às vezes, é possível criar uma dinamicamente, usando o SQL personalizado ou usando uniões de colunas ou de linhas de outras tabelas de dimensão.
Duas tabelas de fatos podem ser relacionadas diretamente uma à outra em uma dimensão comum. Esse tipo de análise funciona melhor quando uma das tabelas de fatos contém um superconjunto da dimensão comum.
Existem vários cenários que podem indicar que você deve construir um modelo de relações multofatoriais com diversas tabelas base em vez de uma única fonte de dados de tabela base:
- Relações circulares. As relações circulares não são compatíveis atualmente. Se você estiver tentando criar uma fonte de dados com um ciclo, use relações multifatoriais e transforme a tabela downstream em outra tabela base.
- Dimensões conformadas e Relações OR contextuais. Se você tiver uma série de tabelas relacionadas nos mesmos conjuntos de cláusulas de relação (como data e local), essas dimensões deverão ser extraídas e transformadas em tabelas compartilhadas.
- Isso é especialmente útil porque múltiplas cláusulas de relacionamento devem ser todas verdadeiras (logicamente, um AND) para que as tabelas sejam relacionadas para esses registros.
- Se, em vez disso, você quiser analisar registros onde um pode ser verdadeiro por vez (um OR contextual), essa flexibilidade será fornecida pela configuração de um modelo de dados com tabelas de dimensões compartilhadas.
- Combinações equivalentes. Se você estiver usando uma combinação, mas quiser ter uma combinação equivalente sem fontes de dados primárias e secundárias, crie um modelo de dados que combine as fontes de dados da combinação com seus campos de vinculação em uma tabela ou tabelas compartilhadas.
Requisitos para relações em um modelo de dados
- Ao relacionar tabelas, os campos que definem as relações devem ter o mesmo tipo de dados. Alterar o tipo de dados na página Fonte de dados não altera esse requisito. O Tableau ainda usará o tipo de dados no banco de dados subjacente para consultas.
- Não é possível definir relações com base em campos geográficos.
- Relações circulares não são aceitos no modelo de dados.
- Não é possível definir relações entre fontes de dados publicadas.
Fatores que limitam os benefícios do uso de tabelas relacionadas
- Dados sujos em tabelas (ou seja, tabelas que não foram criadas com um modelo bem estruturado em mente e contêm uma mistura de medidas e dimensões em várias tabelas) podem tornar a análise de várias tabelas mais complexa.
- O uso de filtros da fonte de dados limitará a capacidade de o Tableau fazer a separação de união nos dados. A separação de união é um termo que se refere ao modo como o Tableau simplifica as consultas, removendo uniões de colunas desnecessárias.
- Tabelas com muitos valores sem correspondência entre relações.
- Nas versões 2020.2 a 2024.1: interrelacionar várias tabelas de fatos com várias tabelas de dimensão (tentando modelar dimensões compartilhadas ou em conformidade). Na versão 2024.2 e posterior, você pode usar relações multifatoriais para resolver esses casos.