Sobre modelos de dados de relação de vários fatos
Relações multifatoriais permitem criar fontes de dados com mais de uma tabela base. O uso de várias tabelas base em seu modelo de dados permite realizar análise de vários fatos no Tableau.
Ao estabelecer árvores de tabelas, enraizadas em uma tabela base, você pode modelar estruturas de dados com diferentes domínios conceituais e usar suas características compartilhadas para conectá-las. Esse tipo de análise costuma ser chamada de análise de vários fatos, dimensões conformadas ou dimensões compartilhadas. No Tableau, chamamos isso de modelo de dados de relações multifatoriais porque você usa relações para construí-lo. Um modelo de dados de relações multifatoriais sempre contém diversas tabelas base. As tabelas base são as tabelas mais à esquerda no modelo de dados. Para obter orientação sobre como determinar quais tabelas usar como tabelas base, consulte Quando usar um modelo de relação de vários fatos.
Níveis de relações
Os modelos de dados com múltiplas tabelas base têm muita flexibilidade em relação à maneira como os dados podem se relacionar – ou não – entre si.
Observação: a relação em qualquer nível só é relevante em modelos de dados com múltiplas tabelas base. Antes dos modelos de dados de relações multifatoriais, ou tudo estava relacionado (uma única fonte de dados) ou nada estava (combinação de várias fontes de dados).
Relações no modelo de dados
As tabelas são relacionadas, não relacionadas ou compartilhadas com base na estrutura do modelo de dados. Em uma fonte de dados, a relação das tabelas é uma constante. Como uma breve visão geral:
- Tabelas relacionadas estão na mesma árvore.
- Antes de 2024.2, todas as fontes de dados eram fontes de dados de tabela base única que consistiam em uma única árvore e, em uma única fonte de dados de tabela base, todas as tabelas estavam relacionadas.
- Tabelas não relacionadas estão em árvores diferentes. As tabelas base sempre não estão relacionadas entre si. As tabelas que estão abaixo de exatamente uma tabela base também não estão relacionadas às tabelas em outras árvores.
- Tabelas compartilhadas têm várias relações de entrada e pertencem a mais de uma árvore.
- As tabelas downstream de uma tabela com várias relações de entrada também são consideradas compartilhadas.
Relações durante a análise
Os campos podem ser relacionados, não relacionados, ainda não relacionados, relacionados de forma ambígua ou podem atuar como campos de junção. A relação entre um grupo de campos é determinada a cada planilha com base na estrutura do modelo de dados, quais campos estão ativamente em uso (ou seja, nas divisórias como pílulas) e se esses campos são dimensões ou medidas.
Para fazer uma visualização com campos de várias tabelas, o Tableau precisa fazer uniões de colunas nos bastidores para calcular os valores. O tipo de união de coluna usada depende da relação entre os campos. Como uma breve visão geral:
- Quando Campos relacionados são usados em uma visualização, as dimensões são unidas internamente e os valores de medida são divididos pelas dimensões.
- É um pouco mais complicado do que isso, podem ser necessárias uniões de colunas adicionais nos bastidores para garantir que nenhum valor de medida seja descartado. Mas em uma visualização apenas de dimensão, as dimensões relacionadas são unidas internamente, e esse é o conceito principal aqui.
- Este é o mesmo comportamento dos modelos de tabela de base única.
- Quando campos não relacionados são usados em uma visualização, as dimensões são unidas de forma cruzada. Os valores de medida têm escopo na tabela (ou seja, são agregados localmente em um único valor para toda a tabela) e repetidos.
- Também é possível que os campos sejam ainda não relacionados ou ambiguamente relacionados, o que significa que para a combinação dos campos ativos existe mais de uma forma de resolver as relações entre suas tabelas. Se o Tableau encontrar incerteza, ele tratará os campos como não relacionados.
- Quando os campos são unidos com base em um campo compartilhado, as uniões de colunas das dimensões são externas. Os valores de medida são agregados no nível de quaisquer dimensões pelas quais possam ser divididos e possam ser repetidos.
- Dimensões de união são semelhantes a vinculando campos na combinação de dados. Os resultados são calculados para cada par de campos relacionados e, em seguida, os valores não relacionados são unidos aos valores compartilhados da dimensão compartilhada entre eles.
Todos esses conceitos e definições são discutidos com mais detalhes posteriormente neste tópico.
No quadro, medidas são agregações – elas são agregadas até a granularidade definida pelas dimensões na exibição. O valor de uma medida depende, portanto, do contexto das dimensões. Por exemplo, “número de caixas de cereais” depende se nos referimos ao estoque total ou ao número de caixas por marca.
Dimensões geralmente são campos categóricos, como país ou marca. No Tableau, as dimensões definem a granularidade ou o nível de detalhe, da exibição. Normalmente, queremos agrupar nossos dados em marcas por alguma combinação de categorias. As dimensões que usamos para criar a exibição determinam quantas marcas temos.
Quando uma medida é usada sem dimensões, diz-se que é escopo da tabela. Isso significa que seu valor é o valor totalmente agregado de toda a tabela. Assim que usamos uma dimensão como marca na visualização, a medida é detalhada de forma mais granular. O número total de caixas de cereais passou a ser por marca.
Agregação refere-se a como os dados estão combinados. A agregação padrão do Tableau é SUM. Você pode alterar a agregação para outras opções, incluindo: média, mediana, contagem distinta, mínimo e assim por diante. Granularidade refere-se ao quão detalhada ou detalhada é a medida – o que é controlado pelas dimensões. A menos que a granularidade da medida esteja no nível da linha (também conhecida como desagregada), seu valor deverá ser agregado.
Exemplo
Qual é o valor de “número de caixas de cereal?”
Bem, isso depende do tipo de agregação e da granularidade definida pelas dimensões.
- Agregações:
- Soma (ou total)
- Average
- Granularidade:
- Escopo da tabela/totalmente agregada (as barras azuis no exemplo)
- Dividido pela dimensão Marca (as barras coloridas no exemplo)
Indicadores de relação em nível de campo
Existem diversas dicas visuais que podem ajudá-lo a entender o grau de parentesco dos campos que você está usando em uma análise.
Indicadores de relações em uma planilha
- Ícone não relacionado: o Tableau usa um ícone não relacionado para indicar que nem tudo na visualização está relacionado. Se você vir um ícone não relacionado em uma pílula na exibição ou no painel Dados, passe o mouse sobre o ícone para obter mais informações.
- O ícone relacionado indica que o campo está unindo campos não relacionados.
- Nomes de campos em cinza claro: os nomes dos campos são exibidos em texto cinza claro no painel Dados quando não estão relacionados a qualquer campos em uso nas divisórias. Você ainda pode usar esses campos para análise nessa visualização, mas os campos não relacionados são avaliado de forma diferente na análise do que campos relacionados. Ao passar o mouse, esses campos também exibem um ícone não relacionado.
Observação: nas versões anteriores do Tableau, os nomes dos campos em cinza claro indicavam que os campos estavam ocultos e Mostrar campos ocultos foi selecionado. Os campos ocultos, quando exibidos, agora são indicados com um ícone de olho clicável .
Caixa de diálogo de aviso de relação
Quando campos não relacionados são usados com uma visualização, o Tableau mostra uma caixa de diálogo de aviso para informar que os campos não estão relacionados. Este aviso aparece sempre que você adiciona um campo não relacionado para evitar junções cruzadas acidentais que podem afetar o desempenho.
- Se você quiser usar campos não relacionados sem costura, clique em Adicionar para continuar adicionando o campo à visualização.
- Se você quiser unir campos não relacionados, uma prática recomendada é destacar o campo de união antes de um campo não relacionado. A caixa de diálogo não será exibida se o campo de união já estiver em uso. Consulte Como as uniões de colunas são usadas para cada nível de relacionamento para obter mais informações sobre como a união evita uniões de coluna cruzadas.
Se vários campos estiverem sendo adicionados ou já estiverem presentes na visualização, a área Detalhes aparece na caixa de diálogo. Expanda-a para ver mais informações sobre a relação de todos os campos em uso e identifique de onde vem o problema de não relação.
Para impedir que a mensagem de aviso apareça, selecione a opção Não mostrar isso novamente. Você sempre pode reativar essas mensagens de aviso ativando-as novamente:
- Em Tableau Desktop, abra o menu Ajuda > Configurações e desempenho > Redefinir mensagens ignoradas.
- Em um navegador, limpe seus dados em cache. Por exemplo, no Chrome, abra o menu de 3 pontos > Excluir dados de navegação... > Escolha “Imagens e arquivos armazenados em cache” > Apagar dados.
Relação em nível de tabela no modelo de dados
Em um modelo de dados com múltiplas tabelas base, cada tabela base define um conjunto de tabelas que estão relacionadas e formam uma árvore conceitual. Essas árvores devem estar conectadas por pelo menos uma tabela compartilhada para garantir que a fonte de dados geral seja uma entidade única.
O que anteriormente poderiam ter sido duas fontes de dados combinadas usando campos de vinculação, agora pode ser uma única fonte de dados com duas árvores, conectadas pelas tabelas compartilhadas que contêm esses campos comuns.
Dica: o modo como as tabelas são relacionadas no modelo de dados impacta o modo como seus campos podem ser relacionados na análise. Pode ser útil consultar a guia Fonte de dados durante a análise para ver como uma tabela se ajusta ao modelo de dados geral.
Vamos conferir quais tabelas estão relacionadas, não relacionadas ou compartilhadas usando este exemplo de fonte de dados. Existem duas árvores, uma estabelecida pela Tabela base A e outra pela Tabela base B.
Tabelas não relacionadas
As tabelas base não estão fundamentalmente relacionadas. Da mesma forma, quaisquer tabelas que existam somente em uma única árvore não estão relacionadas às tabelas de outras árvores.
Tabela A e Tabela X não estão relacionadas | Tabela B e Tabela X não estão relacionadas |
Tabelas relacionadas
As tabelas na mesma árvore são consideradas relacionadas.
Tabela A e Tabela S estão relacionadas | A Tabela B e a Tabela S estão relacionadas (por meio da Tabela A) |
Tabelas compartilhadas
As tabelas compartilhadas têm várias relações de entrada. Essas tabelas pertencem a diversas árvores e são compartilhadas entre elas.
A Tabela S e a Tabela T são compartilhadas.
Relação em nível de campo na análise
A relação entre os campos é determinada a cada planilha com base na estrutura do modelo de dados, quais campos estão ativamente em uso (ou seja, quais campos estão na visualização como comprimidos nas prateleiras) e se esses campos são dimensões ou medidas. O modo como a relação de campo afeta os resultados de uma visualização é abordado na próxima seção.
Vamos examinar alguns cenários usando a mesma fonte de dados de exemplo. O nome de cada campo indica de qual tabela ele pertence, como CampoB da Tabela B. Os campos podem ser dimensões ou medidas, salvo indicação em contrário.
Campos relacionados
Em um nível mais alto, os campos são relacionados quando o Tableau consegue determinar claramente como avaliá-los juntos, com base em um caminho de relação em uma única árvore.
Por exemplo, FieldB (da Tabela B) e FieldS (da Tabela S) estão relacionados.
Campos não relacionados
Em um nível superior, os campos não estão relacionados em qualquer caso, quando não estão relacionados. Isso pode ocorrer porque os campos são de tabelas não relacionadas, como o uso de campos de duas tabelas base. Nesse caso, os campos de diferentes tabelas base não estão fundamentalmente relacionados.
Por exemplo, FieldA e FieldX não estão relacionados.
Ou os campos podem ser tratados como não relacionados por um determinado momento, como em casos relacionados de forma ambígua ou ainda não relacionados. Na maior parte, você pode confiar em indicadores de relação para alertar você quando os campos não estiverem relacionados no contexto de uma visualização.
Dimensão da união
A união é como o Tableau avalia campos de tabelas não relacionadas em um modelo de dados de vários fatos durante a análise. Em uma visualização, o uso de uma dimensão de uma tabela compartilhada costure campos que de outra forma não seriam relacionados e permite que eles sejam avaliados simultaneamente na mesma visualização. Pense nisso como uma justaposição de resultados de duas árvores com base em uma dimensão que elas compartilham.
Por exemplo, se uma visualização for criada com FieldA e FieldX, esses dois campos não estarão relacionados. Adicionar DimensionS introduz um campo de união.
- FieldA e DimensionS são avaliados em conjunto.
- FieldX e DimensionS são avaliados em conjunto.
- Esses resultados intermediários são reunidos com base nos valores de DimensionS.
- FieldA e FieldX agora estão unidos.
Dica: uma prática recomendada é usar um campo de união na visualização antes de exibir um campo não relacionado. Por exemplo, arraste DimensionS primeiro, ou FieldA, depois DimensionS e depois FieldX, em vez de FieldA, FieldX e depois DimensionS. Adicionar o campo de união primeiro garante que o Tableau esteja sempre ciente de como avaliar as relações e evita possíveis problemas de desempenho ao avaliar dimensões não relacionadas em conjunto com uniões de colunas cruzadas.
A junção requer que uma dimensão de uma tabela compartilhada esteja ativa na visualização. Os campos colocados na divisória Filtros ou na propriedade Dica de ferramenta do cartão Marcas não são considerados ativos para fins de união.
Campos ainda não relacionados
Os campos também podem ter diversas maneiras de se relacionar, mas ainda não estão. Isso acontece quando há mais de um relacionamento possível entre duas tabelas compartilhadas (ou tabelas compartilhadas downstream).
Considere FieldS e FieldT. Suas tabelas estão relacionadas entre si tanto por meio da árvore definida pela Tabela base A quanto por meio da árvore definida pela Tabela base X.
Em uma visualização apenas com FieldS e FieldT, há informações sobre qual árvore deve ser usada para relacioná-los. Sem informações adicionais, o Tableau não pode avaliar se esses campos devem ser relacionados por meio da árvore da Tabela base A ou da árvore da Tabela base B.
FieldS e FieldT são tratados como não relacionados, embora existam vários relacionamentos potenciais.
Esses campos que poderiam ser, mas ainda não estão relacionados, são avaliados como não relacionados porque o Tableau não consegue determinar claramente o caminho do relacionamento. Ao contrário dos campos verdadeiramente não relacionados, que só podem ser agrupados, os campos ainda não relacionados podem ser resolvidos e os campos podem ser diretamente relacionados.
Campos ambiguamente relacionados
Os campos também podem estar relacionados de forma ambígua. Isso acontece quando há mais de um relacionamento possível ativo entre tabelas compartilhadas (ou tabelas compartilhadas downstream). Diferentemente de campos ainda não relacionados, que podem ser considerados hipo-relacionados ou sub-relacionados, campos ambiguamente relacionados são hiper-relacionados ou super-relacionados.
Considere FieldS e FieldT. Suas tabelas estão relacionadas entre si tanto por meio da árvore definida pela Tabela base A quanto por meio da árvore definida pela Tabela base X.
Em uma visualização com FieldA, Field X, FieldS e FieldT, há muitas informações para decidir qual árvore deve ser usada para relacioná-los. Sem cortar as informações, o Tableau de informações não consegue avaliar se relaciona esses campos por meio da árvore da Tabela base A ou da árvore da Tabela base B.
FieldS e FieldT são tratados como não relacionados, embora existam vários relacionamentos ativos.
Esses campos ambíguos são avaliados como não relacionados porque o Tableau não consegue determinar claramente o caminho do relacionamento. Ao contrário dos campos verdadeiramente não relacionados, que só podem ser agrupados, os campos relacionados de forma ambígua podem ser resolvidos e os campos podem ser diretamente relacionados.
Medir de uma tabela compartilhada
Quando uma dimensão é usada em uma tabela compartilhada, ela une campos de suas tabelas upstream não relacionadas. No entanto, a medida não pode ser unida, e o valor de uma medida depende de suas dimensões relacionadas.
Em uma visualização com DimensionA e DimensionX, essas duas dimensões não estão relacionadas. Se MeasureS for extraída da Tabela S, ela não estará relacionada à combinação DimensionA e DimensionX juntas. Embora possa estar relacionada a qualquer um deles independentemente, não pode estar relacionada a ambas simultaneamente na mesma situação.
Uma medida compartilhada pode ser considerada um tipo de ambiguidade ou excesso de relação e é resolvida da mesma maneira.
Resolver relações não claras entre campos
Sempre que houver incerteza sobre como relacionar campos, o Tableau não tomará uma decisão arbitrária e, em vez disso, os tratará como não relacionados. Muitas vezes é melhor relacionar esses campos esclarecendo a incerteza sobre qual árvore usar.
A resolução de campos ainda não relacionados é feita adicionando um campo para estabelecer qual árvore utilizar. A resolução de campos relacionados de forma ambígua é feita removendo campos para estabelecer qual árvore usar.
Exemplo:
Resolução de ainda não relacionado: adicionar um campo
- Em uma visualização de FieldS e FieldT, adicionar um campo da Tabela A, B ou C à visualização ativa a árvore da Tabela Base A e resolve o caminho desejado entre FieldS e FieldT.
- Alternativamente, usar um campo da Tabela X resolve o caminho desejado entre FieldS e FieldT para a árvore da Tabela Base X.
Resolução de relacionamento de forma ambígua: remover um campo ou campos
- Em uma visualização de FieldA, FieldX, FieldS e FieldT, a remoção de FieldX torna ativa apenas a árvore da Tabela Base A e resolve o caminho desejado entre FieldS e FieldT.
- Alternativamente, remover FieldA resolve o caminho desejado entre FieldS e FieldT através da árvore da Tabela Base X.
Resolução de uma medida compartilhada: remover um ou mais campos
- Em uma visualização de DimensionA, DimensionX e MeasureS, a remoção de DimensionX torna ativa apenas a árvore da Tabela Base A e resolve o caminho desejado entre DimensionA e MeasureS.
- Alternativamente, remover DimensionA resolve o caminho desejado entre DimensionX e MeasureS através da árvore da Tabela Base X.
Ainda não relacionado | Relacionado ambiguamente | A relação resolvida para uma única árvore | |
Relacionado através da Tabela base A | Relacionado através da Tabela base X | ||
Resolver incerteza é semelhante a usar uma expressão de nível de detalhe FIXED (LOD). Em uma expressão FIXED LOD, você informa ao Tableau qual nível de detalhe agregar definindo a declaração de dimensão. A incerteza é resolvida alterando a estrutura da visualização para tornar ativa apenas uma árvore, informando assim ao Tableau quais caminhos de relacionamento ele pode considerar para realizar a análise.
Unir versus resolver incerteza
Tanto unir quanto resolver incerteza são formas de lidar com a falta de relacionamento, mas têm resultados diferentes:
União | Resolvendo a incerteza |
Justapõe campos não relacionados com base em atributos compartilhados | Restringe qual caminho de relacionamento usar quando há várias opções (ambiguidade ou uma medida compartilhada) ou estabelece um caminho de relacionamento quando não há nenhum (ainda não relacionado). |
Usa lógica de tabela base múltipla para calcular resultados | Usa lógica de tabela base única para calcular resultados |
A análise envolve tabelas não relacionadas | A análise envolve tabelas compartilhadas |
Como as uniões de colunas são usadas para cada nível de relacionamento
Após a determinação da relação em nível de campo, o Tableau precisa avaliar os resultados para criar a visualização real. As consultas usadas para calcular os valores mostrados em uma visualização dependem de junções. O fato de os campos serem relacionados, não relacionados ou agrupados tem um impacto diferente nas junções executadas. Lembre-se de que campos relacionados de forma ambígua e ainda não relacionados são tratados como não relacionados neste contexto.
Para explicar o relacionamento e as junções, esta seção aborda tabelas e seus campos, além dos valores nesses campos. Considere o seguinte modelo de dados com duas tabelas base, Classes e Clubes, e uma tabela compartilhada, Alunos.
Classes | Clubes | Alunos |
Campos:
| Campos:
| Campos:
|
Este modelo muito simples ilustra como a lógica de união de colunas de alto nível é calculada para modelos de dados de relacionamento multifatos. Para obter mais informações sobre os conceitos básicos de uniões de colunas usadas em modelos de dados de tabela base única criados em relacionamentos, consulte Como funciona a análise para fontes de dados de múltiplas tabelas que usam relações.
Para este modelo de dados de três tabelas, pode ser tentador configurá-lo como um modelo de tabela base único, como Classes-Alunos-Clubes ou Clubes-Alunos-Classes, ou com Alunos como tabela base. Como regra, os modelos de dados de relação de vários fatos destinam-se a tipos específicos de esquemas de dados ou cenários de análise. Se o seu modelo de dados tem características que são mais adequadas para um modelo de dados de relação de vários fatos, configure-o dessa forma para manter suas tabelas base conceitualmente não relacionadas. No entanto, se seus dados não exigirem esse tipo de estrutura, um modelo de tabela base única poderá ser mais simples de usar.
Neste caso específico, não há nada nessas tabelas, nos dados ou no modelo que realmente exija múltiplas tabelas base. Estamos usando este modelo como exemplo para mantê-lo simples, para que o foco possa estar na lógica de união de colunas. Ou você pode imaginar que há outra tabela relacionada, Salas, que estamos simplesmente ignorando para evitar complicar demais a discussão.
No entanto, como prática recomendada, use apenas um modelo de relação de vários fatos quando seus dados exigirem.
Dimensões relacionadas usam uniões de colunas internas
As dimensões relacionadas têm uniões de coluna internamente. As uniões de coluna internas eliminam quaisquer valores de dimensão que não sejam compartilhados nas duas tabelas.
- O Tableau usa lógica adicional para garantir que os valores das medidas não sejam perdidos. Esta seção usa apenas dimensões para demonstrar os princípios básicos de como o Tableau aplica uniões de coluna internas a dimensões relacionadas.
O exemplo a seguir mostra como as dimensões relacionadas retornam apenas linhas que estão presentes nos dados. Nenhum aluno está na turma Chamadas de Alarme 101, portanto não está presente nos resultados. Cardinal e Jay não estão em nenhuma classe, portanto não estão presentes nos resultados.
Dimensões não relacionadas usam uniões de colunas cruzadas
Dimensões não relacionadas — por si só, sem uma dimensão de união — são unidas de forma cruzada.
Em uma união de colunas cruzada, cada valor de uma dimensão é combinado com cada valor da outra dimensão, mesmo que a combinação resultante não exista realmente nos dados. Neste exemplo, a união de colunas cruzada adiciona uma linha para cada combinação possível de Classe e Clube.
É importante reconhecer quando uma união de colunas cruzada está ocorrendo na sua análise. Embora haja uma linha para Canções Avançadas + Primeiros Socorros na tabela de resultados para a união de colunas cruzada, nenhum aluno está realmente nesta combinação de atividades (veremos a prova disso no exemplo de união na próxima seção).
Por que é importante reconhecer que nem todos os resultados de união de colunas cruzada são baseados em dados? Imagine que você esteja tentando montar um cronograma de aulas e clubes para que não houvesse conflitos para os alunos. Não há alunos em Músicas Avançadas e Primeiros Socorros, então você pode ignorar esse resultado e agendar aquela classe e clube simultaneamente. A união de colunas cruzada não representa combinações de valores que realmente existem nos dados.
Além disso, uniões de coluna cruzadas quando há alta cardinalidade (um grande número de valores exclusivos) podem afetar o desempenho. Imagine unir cada número de telefone com cada endereço de e-mail em seus contatos. Isso seria uma enorme explosão de combinações e uma operação potencialmente custosa.
Dimensões unidas usam uniões de colunas externas
Dimensões não relacionadas — na presença de uma dimensão de união — são unidas externamente.
Neste exemplo, tanto a tabela Classes quanto a tabela Clubes estão relacionadas à tabela compartilhada Alunos, mas não entre si, portanto os campos Classe e Clube não estão relacionados. Adicionar a dimensão Aluno permite que o Tableau saiba quais valores da Classe e quais valores do Clube devem ser justapostos na análise. Chamamos esse comportamento de união de colunas externa de união.
A união é semelhante à combinação de dados, pois há resultados intermediários que são reunidos para formar os resultados gerais. Ao contrário da combinação, entretanto, a união é uma união de colunas externa, não uma união de colunas à esquerda, e não descarta valores de nenhum dos lados. Não há conceito de fontes de dados primárias ou secundárias quando se trata de uma única fonte de dados, portanto, ambos os campos não relacionados recebem precedência igual.
Os resultados intermediários são unidos externamente
O que entra na união de colunas externa dos campos unidos? Uma união de colunas interna imediata é calculada para cada um dos campos não relacionados e para o campo de união, por sua vez, e então esses resultados intermediários são unidos externamente com base nos valores da dimensão de união.
Exemplo
Uma união de coluna interna para Aluno e Classe...
...e uma união de colunas interna para Aluno e Clube...
...são então unidos externamente no Aluno.
Uniões de colunas adicionais para reter medidas
Além da lógica de união de colunas para dimensões, as medidas podem introduzir uniões de colunas adicionais. Quando as relações foram introduzidos pela primeira vez no Tableau, um dos princípios básicos era que os valores de medida não são perdidos. Isso também é mantido em modelos de dados de relações multifatoriais.
Os detalhes essenciais são:
- Os valores de medida são divididos apenas por dimensões relacionadas.
- Os valores de medida são repetidos para dimensões não relacionadas.
- Os valores de dimensão que seriam descartados em visualizações somente de dimensão poderão ser retornados se houver valores de medida relevantes associados a eles.
Observação: lembre-se de que as medidas são agregações: elas são calculadas no nível de detalhe (a granularidade) definido pela combinação de dimensões na visualização. Trata-se de uma medida que está sendo dividida por uma dimensão. Quando uma medida é usada sem dimensões, diz-se que é escopo da tabela. Isso significa que o valor da medida é o valor totalmente agregado. Assim que usamos uma dimensão na visualização, a medida é dividida de forma mais granular com base nos valores da dimensão. O valor de uma medida em uma análise depende, portanto, do contexto das dimensões.
Medidas relacionadas
Considere o subconjunto de valores de dimensão retornados para uma união de colunas interna nas dimensões relacionadas Aluno e Classe. Existem três valores estudantis, Finch, Robin e Sparrow; e três valores de classe, Advanced Songs, Nesting Basics e Flying for Fledgelings.
Se adicionarmos a medida Duração da tabela Classe, vemos que todas as quatro classes são mostradas e há um valor nulo para Aluno. Cada Duração de classe é exibido, no nível de Classe.
Se em vez disso adicionarmos a medida Idade da tabela Aluno, vemos que todos os cinco alunos são mostrados e há dois nulos para Classe. Os resultados preservam todos os alunos, mesmo que eles não estejam na turma. Toda Idade do aluno é exibida, no nível de Aluno.
Medidas não relacionadas
Os valores de medida são repetidos para valores de dimensão não relacionados.
Se olharmos para a medida Comprimento da tabela Classes e a medida não relacionada Clube dimensão, a medida tem escopo de tabela e é repetida em todos os valores de dimensão de Clube.
Na presença de uma dimensão de união, as medidas podem ser divididas e repetidas.
Aqui, a medida Idade vem da tabela Alunos e é dividido por nível de aluno. Cada vez que um aluno é repetido com base nas dimensões para Classe e Clube, o valor Idade é repetido.
Solução de problemas
Considerações ao trabalhar com modelos de dados de relações multifatoriais
Filtros de extração por tabela
Todos os filtros de extração para um modelo de dados de relacionamento multifatorial são por tabela (não generalizados). Por esse motivo, os resultados da filtragem podem ser diferentes entre a conexão ativa e a de extração.
Cálculos em nível de linha
Os cálculos em nível de linha só podem se referir a campos que compartilham a mesma tabela base upstream. Ou seja, os cálculos em nível de linha não podem ser realizados em árvores.
Campos combinados
Todos os campos em um campo combinado devem compartilhar uma tabela upstream. Ou seja, não é possível criar um campo combinado usando campos que estejam em árvores diferentes.
Conjuntos
Os conjuntos só podem ser criados com uma definição que envolva campos que compartilhem a mesma tabela base upstream. No entanto, em uma visualização, a opção Adicionar ao conjunto pode estar disponível em uma marca quando essa marca é definida por campos não relacionados aos campos usados para definir o conjunto. Se você escolher Adicionar ao conjunto, o Tableau adicionará apenas os campos relacionados à definição do conjunto. Isso é diferente do comportamento de Adicionar ao conjunto em fontes de dados de tabela base única, quando Adicionar ao conjunto adiciona tudo o que define a marca.
Validar expressões de nível de detalhe INCLUDE
As expressões de nível de detalhe INCLUDE não podem ser avaliadas em campos não relacionados. Como a relação entre os campos é avaliada folha por folha, é possível ter uma expressão LOD válida no painel Dados ou no editor de cálculo que se torna inválida no contexto de uma visualização específica (na presença de uma dimensão não relacionada). Quando isso acontecer, a pílula LOD ficará vermelha. Você pode atualizar a expressão LOD para remover conflitos de campos não relacionados, alterar a estrutura da visualização ou remover a expressão LOD da visualização.
Atualização da fonte de dados publicada
Como prática recomendada, crie uma cópia de uma fonte de dados publicada existente se você planeja modificá-la para se tornar um modelo de dados de relação de vários fatos quando nem todas as suas pastas de trabalho conectadas precisarem do novo modelo de dados. Não atualize a versão existente da fonte de dados, a menos que todas as suas pastas de trabalho precisem das novas tabelas. Publique a fonte de dados modificada como uma nova fonte de dados e crie novas pastas de trabalho a partir dela. Isso impedirá que as pastas de trabalho existentes sejam convertidas para usar o VDS em vez do servidor de dados quando não precisarem da funcionalidade, evitando a possibilidade de afetar o desempenho.
Problemas resolvidos
Problema resolvido | Corrigido a partir de |
Extrações Fonte de dados local (em uma pasta de trabalho): A tentativa de extrair uma fonte de dados de relações multifatoriais gerará um erro “Essa tabela não existe”. Fonte de dados publicada: a extração de uma fonte de dados de relação de vários fatos publicada parece ter êxito, mas os valores dos campos podem ser trocados. |
Se você ainda encontrar esses problemas no Tableau Desktop ou no Tableau Server, atualize para uma versão de 24 de julho de 2024 ou posterior. |
Expressões de nível de detalhe EXCLUDE Somente LODs INCLUDE devem ser validados na presença de campos não relacionados. No entanto, os LODs EXCLUDE também podem ser marcados incorretamente como inválidos nas mesmas condições. | |
Cálculos de usuário aninhados Os cálculos de usuário aninhados não estão disponíveis em fontes de dados publicadas com um modelo de dados de relações multifatoriais. |
Problemas conhecidos em 2024.2
Indicadores de relações com vários cartões de Marcas
Quando uma visualização é criada com diversas medidas na divisória Linhas ou na divisória Colunas, cada medida recebe seu próprio cartão Marcas. A lógica usada para determinar os indicadores de relação (o ícone não relacionado, o texto nas dicas de ferramentas e a caixa de diálogo de aviso de relação) pode não fornecer os resultados esperados dependendo de qual cartão Marcas está aberto. A visualização em si, entretanto, é calculada corretamente com base na relação de cada par de campos. Há uma correção planejada para esse comportamento.
Processador BatchQuery
BatchQueryProcessor deve ser habilitado para aceitar modelos de dados de relação de vários fatos. Este é o comportamento esperado sem nenhuma correção planejada atualmente.
Tableau Pulse
O Pulse pode não funcionar com modelos de dados de relações multifatoriais. Você pode ser impedido de criar uma definição de métrica ou qualquer métrica criada pode ficar em branco. Esse não é um comportamento esperado, mas ainda não há nenhuma correção planejada.