Sobre modelos de dados de relação de vários fatos

Relações multifatoriais permitem criar fontes de dados com mais de uma tabela base. O uso de várias tabelas base em seu modelo de dados permite realizar análise de vários fatos no Tableau.

Ao estabelecer árvores de tabelas, enraizadas em uma tabela base, você pode modelar estruturas de dados com diferentes domínios conceituais e usar suas características compartilhadas para conectá-las. Esse tipo de análise costuma ser chamada de análise de vários fatos, dimensões conformadas ou dimensões compartilhadas. No Tableau, chamamos isso de modelo de dados de relações multifatoriais porque você usa relações para construí-lo. Um modelo de dados de relações multifatoriais sempre contém diversas tabelas base. As tabelas base são as tabelas mais à esquerda no modelo de dados. Para obter orientação sobre como determinar quais tabelas usar como tabelas base, consulte Quando usar um modelo de relação de vários fatos.

um modelo de tabela base múltipla com uma árvore destacada

Um modelo de dados de múltiplas tabelas base com a árvore de uma tabela base destacada.

Níveis de relações

Os modelos de dados com múltiplas tabelas base têm muita flexibilidade em relação à maneira como os dados podem se relacionar – ou não – entre si.

Observação: a relação em qualquer nível só é relevante em modelos de dados com múltiplas tabelas base. Antes dos modelos de dados de relações multifatoriais, ou tudo estava relacionado (uma única fonte de dados) ou nada estava (combinação de várias fontes de dados).

Relações no modelo de dados

As tabelas são relacionadas, não relacionadas ou compartilhadas com base na estrutura do modelo de dados. Em uma fonte de dados, a relação das tabelas é uma constante. Como uma breve visão geral: 

  • Tabelas relacionadas estão na mesma árvore.
    • Antes de 2024.2, todas as fontes de dados eram fontes de dados de tabela base única que consistiam em uma única árvore e, em uma única fonte de dados de tabela base, todas as tabelas estavam relacionadas.
  • Tabelas não relacionadas estão em árvores diferentes. As tabelas base sempre não estão relacionadas entre si. As tabelas que estão abaixo de exatamente uma tabela base também não estão relacionadas às tabelas em outras árvores.
  • Tabelas compartilhadas têm várias relações de entrada e pertencem a mais de uma árvore.
    • As tabelas downstream de uma tabela com várias relações de entrada também são consideradas compartilhadas.

Relações durante a análise

Os campos podem ser relacionados, não relacionados, ainda não relacionados, relacionados de forma ambígua ou podem atuar como campos de junção. A relação entre um grupo de campos é determinada a cada planilha com base na estrutura do modelo de dados, quais campos estão ativamente em uso (ou seja, nas divisórias como pílulas) e se esses campos são dimensões ou medidas.

uma visualização simples com dois campos não relacionados, um em linhas e outro em colunas, e uma dica de ferramenta não relacionada mostrando

Para fazer uma visualização com campos de várias tabelas, o Tableau precisa fazer uniões de colunas nos bastidores para calcular os valores. O tipo de união de coluna usada depende da relação entre os campos. Como uma breve visão geral: 

  • Quando Campos relacionados são usados em uma visualização, as dimensões são unidas internamente e os valores de medida são divididos pelas dimensões.
    • É um pouco mais complicado do que isso, podem ser necessárias uniões de colunas adicionais nos bastidores para garantir que nenhum valor de medida seja descartado. Mas em uma visualização apenas de dimensão, as dimensões relacionadas são unidas internamente, e esse é o conceito principal aqui.
    • Este é o mesmo comportamento dos modelos de tabela de base única.
  • Quando campos não relacionados são usados em uma visualização, as dimensões são unidas de forma cruzada. Os valores de medida têm escopo na tabela (ou seja, são agregados localmente em um único valor para toda a tabela) e repetidos.
    • Também é possível que os campos sejam ainda não relacionados ou ambiguamente relacionados, o que significa que para a combinação dos campos ativos existe mais de uma forma de resolver as relações entre suas tabelas. Se o Tableau encontrar incerteza, ele tratará os campos como não relacionados.
  • Quando os campos são unidos com base em um campo compartilhado, as uniões de colunas das dimensões são externas. Os valores de medida são agregados no nível de quaisquer dimensões pelas quais possam ser divididos e possam ser repetidos.
    • Dimensões de união são semelhantes a vinculando campos na combinação de dados. Os resultados são calculados para cada par de campos relacionados e, em seguida, os valores não relacionados são unidos aos valores compartilhados da dimensão compartilhada entre eles.

Todos esses conceitos e definições são discutidos com mais detalhes posteriormente neste tópico.

Um observação sobre dimensões e medidas

No quadro, medidas são agregações – elas são agregadas até a granularidade definida pelas dimensões na exibição. O valor de uma medida depende, portanto, do contexto das dimensões. Por exemplo, “número de caixas de cereais” depende se nos referimos ao estoque total ou ao número de caixas por marca.

Dimensões geralmente são campos categóricos, como país ou marca. No Tableau, as dimensões definem a granularidade ou o nível de detalhe, da exibição. Normalmente, queremos agrupar nossos dados em marcas por alguma combinação de categorias. As dimensões que usamos para criar a exibição determinam quantas marcas temos.

Quando uma medida é usada sem dimensões, diz-se que é escopo da tabela. Isso significa que seu valor é o valor totalmente agregado de toda a tabela. Assim que usamos uma dimensão como marca na visualização, a medida é detalhada de forma mais granular. O número total de caixas de cereais passou a ser por marca.

Agregação refere-se a como os dados estão combinados. A agregação padrão do Tableau é SUM. Você pode alterar a agregação para outras opções, incluindo: média, mediana, contagem distinta, mínimo e assim por diante. Granularidade refere-se ao quão detalhada ou detalhada é a medida – o que é controlado pelas dimensões. A menos que a granularidade da medida esteja no nível da linha (também conhecida como desagregada), seu valor deverá ser agregado.

Exemplo

uma tabela de valores para o número de caixas de cereais, em cinco marcas e três tamanhos de caixas

Qual é o valor de “número de caixas de cereal?”

Bem, isso depende do tipo de agregação e da granularidade definida pelas dimensões.

  • Agregações:
    • Soma (ou total)
    • Average
  • Granularidade:
    • Escopo da tabela/totalmente agregada (as barras azuis no exemplo)
    • Dividido pela dimensão Marca (as barras coloridas no exemplo)

Um painel com quatro visualizações, uma para o número de caixas no escopo da tabela resumida (54), uma com o número médio de caixas no escopo da tabela (6) e, em seguida, versões dessas duas divididas pelas cinco marcas

Indicadores de relação em nível de campo

Existem diversas dicas visuais que podem ajudá-lo a entender o grau de parentesco dos campos que você está usando em uma análise.

Indicadores de relações em uma planilha

  • Ícone não relacionado: o Tableau usa um ícone não relacionado ícone não relacionado para indicar que nem tudo na visualização está relacionado. Se você vir um ícone não relacionado em uma pílula na exibição ou no painel Dados, passe o mouse sobre o ícone para obter mais informações.
    • O ícone relacionado indica que o campo está unindo campos não relacionados.
  • Nomes de campos em cinza claro: os nomes dos campos são exibidos em texto cinza claro no painel Dados quando não estão relacionados a qualquer campos em uso nas divisórias. Você ainda pode usar esses campos para análise nessa visualização, mas os campos não relacionados são avaliado de forma diferente na análise do que campos relacionados. Ao passar o mouse, esses campos também exibem um ícone não relacionado.

o painel de dados, com uma tabela inteira esmaecida e dois campos com o ícone de olho cortado para campos ocultos

Observação: nas versões anteriores do Tableau, os nomes dos campos em cinza claro indicavam que os campos estavam ocultos e Mostrar campos ocultos foi selecionado. Os campos ocultos, quando exibidos, agora são indicados com um ícone de olho clicável ícone de campo oculto.

Caixa de diálogo de aviso de relação

Quando campos não relacionados são usados com uma visualização, o Tableau mostra uma caixa de diálogo de aviso para informar que os campos não estão relacionados. Este aviso aparece sempre que você adiciona um campo não relacionado para evitar junções cruzadas acidentais que podem afetar o desempenho.

  • Se você quiser usar campos não relacionados sem costura, clique em Adicionar para continuar adicionando o campo à visualização.
  • Se você quiser unir campos não relacionados, uma prática recomendada é destacar o campo de união antes de um campo não relacionado. A caixa de diálogo não será exibida se o campo de união já estiver em uso. Consulte Como as uniões de colunas são usadas para cada nível de relacionamento para obter mais informações sobre como a união evita uniões de coluna cruzadas.

a caixa de diálogo de aviso de relação mostrando um aviso para dimensões não relacionadas

Se vários campos estiverem sendo adicionados ou já estiverem presentes na visualização, a área Detalhes aparece na caixa de diálogo. Expanda-a para ver mais informações sobre a relação de todos os campos em uso e identifique de onde vem o problema de não relação.

a caixa de diálogo de aviso de relação com uma mensagem para dimensões e medidas não relacionadas e com a área Detalhes expandida

Para impedir que a mensagem de aviso apareça, selecione a opção Não mostrar isso novamente. Você sempre pode reativar essas mensagens de aviso ativando-as novamente:

  • Em Tableau Desktop, abra o menu Ajuda > Configurações e desempenho > Redefinir mensagens ignoradas.
  • Em um navegador, limpe seus dados em cache. Por exemplo, no Chrome, abra o menu de 3 pontosExcluir dados de navegação... > Escolha “Imagens e arquivos armazenados em cache” > Apagar dados.

Relação em nível de tabela no modelo de dados

Em um modelo de dados com múltiplas tabelas base, cada tabela base define um conjunto de tabelas que estão relacionadas e formam uma árvore conceitual. Essas árvores devem estar conectadas por pelo menos uma tabela compartilhada para garantir que a fonte de dados geral seja uma entidade única.

O que anteriormente poderiam ter sido duas fontes de dados combinadas usando campos de vinculação, agora pode ser uma única fonte de dados com duas árvores, conectadas pelas tabelas compartilhadas que contêm esses campos comuns.

dois modelos de dados, um composto por duas fontes de dados distintas, uma das duas fontes de dados sobrepostas às tabelas que têm em comum para formar uma única fonte de dados

Dica: o modo como as tabelas são relacionadas no modelo de dados impacta o modo como seus campos podem ser relacionados na análise. Pode ser útil consultar a guia Fonte de dados durante a análise para ver como uma tabela se ajusta ao modelo de dados geral.

Vamos conferir quais tabelas estão relacionadas, não relacionadas ou compartilhadas usando este exemplo de fonte de dados. Existem duas árvores, uma estabelecida pela Tabela base A e outra pela Tabela base B.

Tabelas não relacionadas

As tabelas base não estão fundamentalmente relacionadas. Da mesma forma, quaisquer tabelas que existam somente em uma única árvore não estão relacionadas às tabelas de outras árvores.

Tabela A e Tabela X não estão relacionadas

Tabela B e Tabela X não estão relacionadas

Um modelo de dados onde as tabelas base A e X têm seus próprios contornos. As relações são mostradas em cinza claro.Um modelo de dados onde as tabelas base A e sua tabela downstream B compartilham um contorno. A tabela base X tem seu próprio contorno. As relações são mostradas em cinza claro.

Tabelas relacionadas

As tabelas na mesma árvore são consideradas relacionadas.

Tabela A e Tabela S estão relacionadas

A Tabela B e a Tabela S estão relacionadas (por meio da Tabela A)

Um modelo de dados onde a relação da Tabela base A com uma tabela downstream é enfatizadaUm modelo de dados em que a relação da Tabela B com outra tabela é enfatizado pelas relações com a mesma tabela base, A

Tabelas compartilhadas

As tabelas compartilhadas têm várias relações de entrada. Essas tabelas pertencem a diversas árvores e são compartilhadas entre elas.

A Tabela S e a Tabela T são compartilhadas.

Um modelo de dados em que as tabelas S e T têm vários relacionamentos de entrada. Ambos pertencem à árvore da tabela base A e à árvore da tabela base X.

Relação em nível de campo na análise

A relação entre os campos é determinada a cada planilha com base na estrutura do modelo de dados, quais campos estão ativamente em uso (ou seja, quais campos estão na visualização como comprimidos nas prateleiras) e se esses campos são dimensões ou medidas. O modo como a relação de campo afeta os resultados de uma visualização é abordado na próxima seção.

Vamos examinar alguns cenários usando a mesma fonte de dados de exemplo. O nome de cada campo indica de qual tabela ele pertence, como CampoB da Tabela B. Os campos podem ser dimensões ou medidas, salvo indicação em contrário.

Campos relacionados

Em um nível mais alto, os campos são relacionados quando o Tableau consegue determinar claramente como avaliá-los juntos, com base em um caminho de relação em uma única árvore.

Por exemplo, FieldB (da Tabela B) e FieldS (da Tabela S) estão relacionados.

FieldB e FieldS estão relacionados

Campos não relacionados

Em um nível superior, os campos não estão relacionados em qualquer caso, quando não estão relacionados. Isso pode ocorrer porque os campos são de tabelas não relacionadas, como o uso de campos de duas tabelas base. Nesse caso, os campos de diferentes tabelas base não estão fundamentalmente relacionados.

Por exemplo, FieldA e FieldX não estão relacionados.

FieldA e FieldX não estão relacionados

Ou os campos podem ser tratados como não relacionados por um determinado momento, como em casos relacionados de forma ambígua ou ainda não relacionados. Na maior parte, você pode confiar em indicadores de relação para alertar você quando os campos não estiverem relacionados no contexto de uma visualização.

Dimensão da união

A união é como o Tableau avalia campos de tabelas não relacionadas em um modelo de dados de vários fatos durante a análise. Em uma visualização, o uso de uma dimensão de uma tabela compartilhada costure campos que de outra forma não seriam relacionados e permite que eles sejam avaliados simultaneamente na mesma visualização. Pense nisso como uma justaposição de resultados de duas árvores com base em uma dimensão que elas compartilham.

Por exemplo, se uma visualização for criada com FieldA e FieldX, esses dois campos não estarão relacionados. Adicionar DimensionS introduz um campo de união.

  • FieldA e DimensionS são avaliados em conjunto.
  • FieldX e DimensionS são avaliados em conjunto.
  • Esses resultados intermediários são reunidos com base nos valores de DimensionS.
  • FieldA e FieldX agora estão unidos.

tabelas base não relacionadas A e X unidas por sua tabela compartilhada S

Dica: uma prática recomendada é usar um campo de união na visualização antes de exibir um campo não relacionado. Por exemplo, arraste DimensionS primeiro, ou FieldA, depois DimensionS e depois FieldX, em vez de FieldA, FieldX e depois DimensionS. Adicionar o campo de união primeiro garante que o Tableau esteja sempre ciente de como avaliar as relações e evita possíveis problemas de desempenho ao avaliar dimensões não relacionadas em conjunto com uniões de colunas cruzadas.

A junção requer que uma dimensão de uma tabela compartilhada esteja ativa na visualização. Os campos colocados na divisória Filtros ou na propriedade Dica de ferramenta do cartão Marcas não são considerados ativos para fins de união.

Campos ainda não relacionados

Os campos também podem ter diversas maneiras de se relacionar, mas ainda não estão. Isso acontece quando há mais de um relacionamento possível entre duas tabelas compartilhadas (ou tabelas compartilhadas downstream).

Considere FieldS e FieldT. Suas tabelas estão relacionadas entre si tanto por meio da árvore definida pela Tabela base A quanto por meio da árvore definida pela Tabela base X.

Em uma visualização apenas com FieldS e FieldT, há informações sobre qual árvore deve ser usada para relacioná-los. Sem informações adicionais, o Tableau não pode avaliar se esses campos devem ser relacionados por meio da árvore da Tabela base A ou da árvore da Tabela base B.

FieldS e FieldT são tratados como não relacionados, embora existam vários relacionamentos potenciais.

Campos ambíguos sub-relacionados S e T

Esses campos que poderiam ser, mas ainda não estão relacionados, são avaliados como não relacionados porque o Tableau não consegue determinar claramente o caminho do relacionamento. Ao contrário dos campos verdadeiramente não relacionados, que só podem ser agrupados, os campos ainda não relacionados podem ser resolvidos e os campos podem ser diretamente relacionados.

Campos ambiguamente relacionados

Os campos também podem estar relacionados de forma ambígua. Isso acontece quando há mais de um relacionamento possível ativo entre tabelas compartilhadas (ou tabelas compartilhadas downstream). Diferentemente de campos ainda não relacionados, que podem ser considerados hipo-relacionados ou sub-relacionados, campos ambiguamente relacionados são hiper-relacionados ou super-relacionados.

Considere FieldS e FieldT. Suas tabelas estão relacionadas entre si tanto por meio da árvore definida pela Tabela base A quanto por meio da árvore definida pela Tabela base X.

Em uma visualização com FieldA, Field X, FieldS e FieldT, há muitas informações para decidir qual árvore deve ser usada para relacioná-los. Sem cortar as informações, o Tableau não consegue avaliar se relaciona esses campos por meio da árvore da Tabela base A ou da árvore da Tabela base B.

FieldS e FieldT são tratados como não relacionados, embora existam vários relacionamentos ativos.

Esses campos de relação ambígua são avaliados como não relacionados porque o Tableau não consegue determinar claramente o caminho do relacionamento. Ao contrário dos campos verdadeiramente não relacionados, que só podem ser agrupados, os campos relacionados de forma ambígua podem ser resolvidos e os campos podem ser diretamente relacionados.

Medir de uma tabela compartilhada

Quando uma dimensão é usada em uma tabela compartilhada, ela une campos de suas tabelas upstream não relacionadas. No entanto, a medida não pode ser unida, e o valor de uma medida depende de suas dimensões relacionadas.

Em uma visualização com DimensionA e DimensionX, essas duas dimensões não estão relacionadas. Se MeasureS for extraída da Tabela S, ela não estará relacionada à combinação DimensionA e DimensionX juntas. Embora possa estar relacionada a qualquer um deles independentemente, não pode estar relacionada a ambas simultaneamente na mesma situação.

tabelas base não relacionadas A e X unidas por sua tabela compartilhada S

Uma medida compartilhada pode ser considerada um tipo de ambiguidade ou excesso de relação e é resolvida da mesma maneira.

Resolver relações não claras entre campos

Sempre que houver incerteza sobre como relacionar campos, o Tableau não tomará uma decisão arbitrária e, em vez disso, os tratará como não relacionados. Muitas vezes é melhor relacionar esses campos esclarecendo a incerteza sobre qual árvore usar.

A resolução de campos ainda não relacionados é feita adicionando um campo para estabelecer qual árvore utilizar. A resolução de campos relacionados de forma ambígua é feita removendo campos para estabelecer qual árvore usar.

Exemplo:

Resolução de ainda não relacionado: adicionar um campo

  • Em uma visualização de FieldS e FieldT, adicionar um campo da Tabela A, B ou C à visualização ativa a árvore da Tabela Base A e resolve o caminho desejado entre FieldS e FieldT.
  • Alternativamente, usar um campo da Tabela X resolve o caminho desejado entre FieldS e FieldT para a árvore da Tabela Base X.

Resolução de relacionamento de forma ambígua: remover um campo ou campos

  • Em uma visualização de FieldA, FieldX, FieldS e FieldT, a remoção de FieldX torna ativa apenas a árvore da Tabela Base A e resolve o caminho desejado entre FieldS e FieldT.
  • Alternativamente, remover FieldA resolve o caminho desejado entre FieldS e FieldT através da árvore da Tabela Base X.

Resolução de uma medida compartilhada: remover um ou mais campos

  • Em uma visualização de DimensionA, DimensionX e MeasureS, a remoção de DimensionX torna ativa apenas a árvore da Tabela Base A e resolve o caminho desejado entre DimensionA e MeasureS.
  • Alternativamente, remover DimensionA resolve o caminho desejado entre DimensionX e MeasureS através da árvore da Tabela Base X.
Ainda não relacionadoRelacionado ambiguamenteA relação resolvida para uma única árvore
Relacionado através da Tabela base ARelacionado através da Tabela base X
sub-relacionadorelacionado através de Arelacionado através de X

Resolver incerteza é semelhante a usar uma expressão de nível de detalhe FIXED (LOD). Em uma expressão FIXED LOD, você informa ao Tableau qual nível de detalhe agregar definindo a declaração de dimensão. A incerteza é resolvida alterando a estrutura da visualização para tornar ativa apenas uma árvore, informando assim ao Tableau quais caminhos de relacionamento ele pode considerar para realizar a análise.

Unir versus resolver incerteza

Tanto unir quanto resolver incerteza são formas de lidar com a falta de relacionamento, mas têm resultados diferentes:

União

Resolvendo a incerteza

Unindo A e X com S

FieldA e FieldX não relacionados unidos por DimensionS

Resolvendo S e T com A

FieldS e FieldT avaliados através da árvore definida pela Tabela base A

Justapõe campos não relacionados com base em atributos compartilhadosRestringe qual caminho de relacionamento usar quando há várias opções (ambiguidade ou uma medida compartilhada) ou estabelece um caminho de relacionamento quando não há nenhum (ainda não relacionado).

Usa lógica de tabela base múltipla para calcular resultados

Usa lógica de tabela base única para calcular resultados

A análise envolve tabelas não relacionadasA análise envolve tabelas compartilhadas

Como as uniões de colunas são usadas para cada nível de relacionamento

Após a determinação da relação em nível de campo, o Tableau precisa avaliar os resultados para criar a visualização real. As consultas usadas para calcular os valores mostrados em uma visualização dependem de junções. O fato de os campos serem relacionados, não relacionados ou agrupados tem um impacto diferente nas junções executadas. Lembre-se de que campos relacionados de forma ambígua e ainda não relacionados são tratados como não relacionados neste contexto.

Para explicar o relacionamento e as junções, esta seção aborda tabelas e seus campos, além dos valores nesses campos. Considere o seguinte modelo de dados com duas tabelas base, Classes e Clubes, e uma tabela compartilhada, Alunos.

Um modelo de dados com duas tabelas base, classes e clubes, e uma tabela compartilhada, alunos

Classes

Clubes

Alunos

visualizar dados da tabela de classes, mostrando os valores de três camposvisualizar dados da tabela de clubes, mostrando os valores de três camposvisualizar dados da tabela de alunos, mostrando os valores de três campos

Campos:

  • Classes, uma dimensão com valores de Noções básicas de aninhamento, músicas avançadas, voo para iniciantes e chamadas de alarme 101
  • Comprimento, uma medida
  • Aluno, uma dimensão usada para se relacionar com a tabela Aluno

Campos:

  • Clube, uma dimensão com valores de Fotografia, Viagem, Malabarismo, Arte e Primeiros Socorros
  • Taxas, uma medida
  • Aluno, uma dimensão usada para se relacionar com a tabela Aluno

Campos:

  • Piloto de ônibus, uma dimensão com valores de sim ou não
  • Aluno, uma dimensão com valores de Finch, Cardinal, Sparrow, Robin e Jay. Usado para se relacionar com as outras duas tabelas
  • Idade, uma medida

Este modelo muito simples ilustra como a lógica de união de colunas de alto nível é calculada para modelos de dados de relacionamento multifatos. Para obter mais informações sobre os conceitos básicos de uniões de colunas usadas em modelos de dados de tabela base única criados em relacionamentos, consulte Como funciona a análise para fontes de dados de múltiplas tabelas que usam relações.

Este exemplo deveria ser um modelo de dados com múltiplas tabelas base?

Para este modelo de dados de três tabelas, pode ser tentador configurá-lo como um modelo de tabela base único, como Classes-Alunos-Clubes ou Clubes-Alunos-Classes, ou com Alunos como tabela base. Como regra, os modelos de dados de relação de vários fatos destinam-se a tipos específicos de esquemas de dados ou cenários de análise. Se o seu modelo de dados tem características que são mais adequadas para um modelo de dados de relação de vários fatos, configure-o dessa forma para manter suas tabelas base conceitualmente não relacionadas. No entanto, se seus dados não exigirem esse tipo de estrutura, um modelo de tabela base única poderá ser mais simples de usar.

estruturas de modelo de dados alternativas para o modelo de exemplo de classes-clubes-alunos

Modelos que poderiam ser construídos para estas três tabelas: (1) Classes e Clubes como tabelas base com Alunos como uma tabela compartilhada, (2) linearmente, começando com Classes ou Clubes, e (3) Alunos como uma única tabela base com Classes e clubes como tabelas downstream.

Neste caso específico, não há nada nessas tabelas, nos dados ou no modelo que realmente exija múltiplas tabelas base. Estamos usando este modelo como exemplo para mantê-lo simples, para que o foco possa estar na lógica de união de colunas. Ou você pode imaginar que há outra tabela relacionada, Salas, que estamos simplesmente ignorando para evitar complicar demais a discussão.

uma versão do modelo aulas-clubes-alunos com mesa compartilhada adicional, salas

No entanto, como prática recomendada, use apenas um modelo de relação de vários fatos quando seus dados exigirem.

Dimensões relacionadas usam uniões de colunas internas

As dimensões relacionadas têm uniões de coluna internamente. As uniões de coluna internas eliminam quaisquer valores de dimensão que não sejam compartilhados nas duas tabelas.

  • O Tableau usa lógica adicional para garantir que os valores das medidas não sejam perdidos. Esta seção usa apenas dimensões para demonstrar os princípios básicos de como o Tableau aplica uniões de coluna internas a dimensões relacionadas.

O exemplo a seguir mostra como as dimensões relacionadas retornam apenas linhas que estão presentes nos dados. Nenhum aluno está na turma Chamadas de Alarme 101, portanto não está presente nos resultados. Cardinal e Jay não estão em nenhuma classe, portanto não estão presentes nos resultados.

Uma visualização mostrando uma união de coluna interna de Turma e Aluno, com duas linhas para Finch (músicas avançadas, noções básicas de aninhamento), duas linhas para Robin (voo para iniciantes, noções básicas de aninhamento) e duas linhas para Sparrow (músicas avançadas, noções básicas de aninhamento)

Dimensões não relacionadas usam uniões de colunas cruzadas

Dimensões não relacionadas — por si só, sem uma dimensão de união — são unidas de forma cruzada.

Em uma união de colunas cruzada, cada valor de uma dimensão é combinado com cada valor da outra dimensão, mesmo que a combinação resultante não exista realmente nos dados. Neste exemplo, a união de colunas cruzada adiciona uma linha para cada combinação possível de Classe e Clube.

Uma visualização mostrando uma união de colunas cruzada de Classe e Clube com linhas para cada combinação de Músicas Avançadas/Chamadas de Alarme 101/Voo para iniciantes/Noções Básicas de Aninhamento com Arte/Primeiros Socorros/Malabarismo/Fotografia. Há um ícone não relacionado mostrado em ambos os comprimidos de dimensão na divisória Linhas

É importante reconhecer quando uma união de colunas cruzada está ocorrendo na sua análise. Embora haja uma linha para Canções Avançadas + Primeiros Socorros na tabela de resultados para a união de colunas cruzada, nenhum aluno está realmente nesta combinação de atividades (veremos a prova disso no exemplo de união na próxima seção).

Por que é importante reconhecer que nem todos os resultados de união de colunas cruzada são baseados em dados? Imagine que você esteja tentando montar um cronograma de aulas e clubes para que não houvesse conflitos para os alunos. Não há alunos em Músicas Avançadas e Primeiros Socorros, então você pode ignorar esse resultado e agendar aquela classe e clube simultaneamente. A união de colunas cruzada não representa combinações de valores que realmente existem nos dados.

Além disso, uniões de coluna cruzadas quando há alta cardinalidade (um grande número de valores exclusivos) podem afetar o desempenho. Imagine unir cada número de telefone com cada endereço de e-mail em seus contatos. Isso seria uma enorme explosão de combinações e uma operação potencialmente custosa.

Dimensões unidas usam uniões de colunas externas

Dimensões não relacionadas — na presença de uma dimensão de união — são unidas externamente.

Neste exemplo, tanto a tabela Classes quanto a tabela Clubes estão relacionadas à tabela compartilhada Alunos, mas não entre si, portanto os campos Classe e Clube não estão relacionados. Adicionar a dimensão Aluno permite que o Tableau saiba quais valores da Classe e quais valores do Clube devem ser justapostos na análise. Chamamos esse comportamento de união de colunas externa de união.

Uma visualização que mostra os resultados de uma união de colunas externa da união de colunas interna Aluno-Classe e da união de colunas interna Aluno-Clube. Há um ícone não relacionado nas pílulas de Classe e Clube na prateleira de Linhas. Uma pílula para Aluno está na propriedade Cor do cartão Marcas e não possui um ícone não relacionado. Nem todas as combinações de classes e clubes estão representadas e há filas para alunos e clubes sem

A união é semelhante à combinação de dados, pois há resultados intermediários que são reunidos para formar os resultados gerais. Ao contrário da combinação, entretanto, a união é uma união de colunas externa, não uma união de colunas à esquerda, e não descarta valores de nenhum dos lados. Não há conceito de fontes de dados primárias ou secundárias quando se trata de uma única fonte de dados, portanto, ambos os campos não relacionados recebem precedência igual.

Os resultados intermediários são unidos externamente

O que entra na união de colunas externa dos campos unidos? Uma união de colunas interna imediata é calculada para cada um dos campos não relacionados e para o campo de união, por sua vez, e então esses resultados intermediários são unidos externamente com base nos valores da dimensão de união.

Exemplo

Uma união de coluna interna para Aluno e Classe...

Uma tabela de resultados para três valores de alunos e três valores de turmas

...e uma união de colunas interna para Aluno e Clube...

Uma tabela de resultados para quatro valores de alunos e cinco valores de clubes

...são então unidos externamente no Aluno.

Uma tabela de resultados para quatro valores de alunos, três valores de turmas e cinco valores de clubes

Uniões de colunas adicionais para reter medidas

Além da lógica de união de colunas para dimensões, as medidas podem introduzir uniões de colunas adicionais. Quando as relações foram introduzidos pela primeira vez no Tableau, um dos princípios básicos era que os valores de medida não são perdidos. Isso também é mantido em modelos de dados de relações multifatoriais.

Os detalhes essenciais são:

  • Os valores de medida são divididos apenas por dimensões relacionadas.
  • Os valores de medida são repetidos para dimensões não relacionadas.
  • Os valores de dimensão que seriam descartados em visualizações somente de dimensão poderão ser retornados se houver valores de medida relevantes associados a eles.

Observação: lembre-se de que as medidas são agregações: elas são calculadas no nível de detalhe (a granularidade) definido pela combinação de dimensões na visualização. Trata-se de uma medida que está sendo dividida por uma dimensão. Quando uma medida é usada sem dimensões, diz-se que é escopo da tabela. Isso significa que o valor da medida é o valor totalmente agregado. Assim que usamos uma dimensão na visualização, a medida é dividida de forma mais granular com base nos valores da dimensão. O valor de uma medida em uma análise depende, portanto, do contexto das dimensões.

Medidas relacionadas

Considere o subconjunto de valores de dimensão retornados para uma união de colunas interna nas dimensões relacionadas AlunoClasse. Existem três valores estudantis, Finch, Robin e Sparrow; e três valores de classe, Advanced Songs, Nesting Basics e Flying for Fledgelings.

uma tabela de resultados para uma união de colunas interna entre aluno e turma

Se adicionarmos a medida Duração da tabela Classe, vemos que todas as quatro classes são mostradas e há um valor nulo para Aluno. Cada Duração de classe é exibido, no nível de Classe.

Um valor nulo aparece para o aluno mesmo que as dimensões sejam unidas internamente

Se em vez disso adicionarmos a medida Idade da tabela Aluno, vemos que todos os cinco alunos são mostrados e há dois nulos para Classe. Os resultados preservam todos os alunos, mesmo que eles não estejam na turma. Toda Idade do aluno é exibida, no nível de Aluno.

Um valor nulo aparece para classes mesmo que as dimensões sejam unidas internamente

Medidas não relacionadas

Os valores de medida são repetidos para valores de dimensão não relacionados.

Se olharmos para a medida Comprimento da tabela Classes e a medida não relacionada Clube dimensão, a medida tem escopo de tabela e é repetida em todos os valores de dimensão de Clube.

uma medida com escopo de tabela repetida em valores de dimensão não relacionados

Na presença de uma dimensão de união, as medidas podem ser divididas e repetidas.

Aqui, a medida Idade vem da tabela Alunos e é dividido por nível de aluno. Cada vez que um aluno é repetido com base nas dimensões para Classe e Clube, o valor Idade é repetido.

Solução de problemas

Considerações ao trabalhar com modelos de dados de relações multifatoriais

Filtros de extração por tabela

Todos os filtros de extração para um modelo de dados de relacionamento multifatorial são por tabela (não generalizados). Por esse motivo, os resultados da filtragem podem ser diferentes entre a conexão ativa e a de extração.

Cálculos em nível de linha

Os cálculos em nível de linha só podem se referir a campos que compartilham a mesma tabela base upstream. Ou seja, os cálculos em nível de linha não podem ser realizados em árvores.

Campos combinados

Todos os campos em um campo combinado devem compartilhar uma tabela upstream. Ou seja, não é possível criar um campo combinado usando campos que estejam em árvores diferentes.

Conjuntos

Os conjuntos só podem ser criados com uma definição que envolva campos que compartilhem a mesma tabela base upstream. No entanto, em uma visualização, a opção Adicionar ao conjunto pode estar disponível em uma marca quando essa marca é definida por campos não relacionados aos campos usados para definir o conjunto. Se você escolher Adicionar ao conjunto, o Tableau adicionará apenas os campos relacionados à definição do conjunto. Isso é diferente do comportamento de Adicionar ao conjunto em fontes de dados de tabela base única, quando Adicionar ao conjunto adiciona tudo o que define a marca.

Validar expressões de nível de detalhe INCLUDE

As expressões de nível de detalhe INCLUDE não podem ser avaliadas em campos não relacionados. Como a relação entre os campos é avaliada folha por folha, é possível ter uma expressão LOD válida no painel Dados ou no editor de cálculo que se torna inválida no contexto de uma visualização específica (na presença de uma dimensão não relacionada). Quando isso acontecer, a pílula LOD ficará vermelha. Você pode atualizar a expressão LOD para remover conflitos de campos não relacionados, alterar a estrutura da visualização ou remover a expressão LOD da visualização.

Atualização da fonte de dados publicada

Como prática recomendada, crie uma cópia de uma fonte de dados publicada existente se você planeja modificá-la para se tornar um modelo de dados de relação de vários fatos quando nem todas as suas pastas de trabalho conectadas precisarem do novo modelo de dados. Não atualize a versão existente da fonte de dados, a menos que todas as suas pastas de trabalho precisem das novas tabelas. Publique a fonte de dados modificada como uma nova fonte de dados e crie novas pastas de trabalho a partir dela. Isso impedirá que as pastas de trabalho existentes sejam convertidas para usar o VDS em vez do servidor de dados quando não precisarem da funcionalidade, evitando a possibilidade de afetar o desempenho.

Problemas resolvidos

Problema resolvidoCorrigido a partir de

Extrações

Fonte de dados local (em uma pasta de trabalho): A tentativa de extrair uma fonte de dados de relações multifatoriais gerará um erro “Essa tabela não existe”.

Fonte de dados publicada: a extração de uma fonte de dados de relação de vários fatos publicada parece ter êxito, mas os valores dos campos podem ser trocados.

  • Tableau Cloud: resolvido nas atualizações de meados de julho. Isto também se aplica a public.tableau.com.
  • Tableau Desktop: resolvido a partir da versão de manutenção 2024.2.1 lançada em 24 de julho de 2024
  • Tableau Server: resolvido a partir da versão de manutenção 2024.2.1 lançada em 24 de julho de 2024

Se você ainda encontrar esses problemas no Tableau Desktop ou no Tableau Server, atualize para uma versão de 24 de julho de 2024 ou posterior.

Expressões de nível de detalhe EXCLUDE

Somente LODs INCLUDE devem ser validados na presença de campos não relacionados. No entanto, os LODs EXCLUDE também podem ser marcados incorretamente como inválidos nas mesmas condições.

Cálculos de usuário aninhados

Os cálculos de usuário aninhados não estão disponíveis em fontes de dados publicadas com um modelo de dados de relações multifatoriais.

Problemas conhecidos em 2024.2

Indicadores de relações com vários cartões de Marcas

Quando uma visualização é criada com diversas medidas na divisória Linhas ou na divisória Colunas, cada medida recebe seu próprio cartão Marcas. A lógica usada para determinar os indicadores de relação (o ícone não relacionado, o texto nas dicas de ferramentas e a caixa de diálogo de aviso de relação) pode não fornecer os resultados esperados dependendo de qual cartão Marcas está aberto. A visualização em si, entretanto, é calculada corretamente com base na relação de cada par de campos. Há uma correção planejada para esse comportamento.

Processador BatchQuery

BatchQueryProcessor deve ser habilitado para aceitar modelos de dados de relação de vários fatos. Este é o comportamento esperado sem nenhuma correção planejada atualmente.

Tableau Pulse

O Pulse pode não funcionar com modelos de dados de relações multifatoriais. Você pode ser impedido de criar uma definição de métrica ou qualquer métrica criada pode ficar em branco. Esse não é um comportamento esperado, mas ainda não há nenhuma correção planejada.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!