Planejar a fonte de dados

No centro do Tableau, estão os seus dados. O seu sucesso na exploração de dados, na resposta a perguntas e na criação de visualizações para você ou outras pessoas consumirem, tudo isso depende dos dados subjacentes.

Se o seu objetivo é fazer alguma exploração rápida ou análise ad-hoc, você pode entrar, conectar-se a alguns dados, arrastar e soltar um pouco para criar algumas visualizações e sair com as informações necessárias. Porém, se o objetivo é criar uma análise ou fonte de dados que será usada mais de uma vez, é melhor pensar e planejar a fonte de dados.

Fontes de dados do Tableau

A fonte de dados do Tableau é o vínculo entre seus dados de origem e o Tableau. É essencialmente a soma dos dados (como uma conexão em tempo real ou uma extração), as informações de conexão, os nomes de tabelas ou planilhas que contêm dados e as personalizações feitas nos dados para trabalhar com eles no Tableau. Essas personalizações incluem alguns itens: a forma de combinação de dados e os metadados (cálculos, campos renomeados e formatação padrão).

Uma fonte de dados do Tableau pode conter várias conexões de dados com diferentes bancos de dados ou arquivos. As informações de conexão incluem onde os dados estão localizados (como um nome de arquivo e caminho ou um local de rede) e detalhes sobre como se conectar aos dados (como nome do servidor de banco de dados e informações de logon do servidor).

Observação: os termos fonte de dados e conexão de dados foram usados de forma indiscriminada no passado e podem não ter uma distinção clara em materiais mais antigos.

Também é importante ter em mente a diferença entre a fonte de dados do Tableau (acesso do Tableau a seus dados e todas as personalizações que podem estar envolvidas) e os dados de origem em si (como um banco de dados ou uma planilha do Excel). Planejar uma fonte de dados no sentido de projetar um banco de dados não é o escopo deste tópico.

As fontes de dados do Tableau podem permanecer inseridas na pasta de trabalho onde foram originalmente criadas, ou podem ser publicadas separadamente. As fontes de dados publicadas permitem centralização e dimensionamento de fontes de dados coletadas. Consulte Práticas recomendadas para fontes de dados publicadas para obter mais informações.

Combinar dados

Se os dados forem provenientes de uma tabela, você poderá se conectar aos dados para criar a fonte de dados, arrastar a tabela para a tela e começar a criar sua exibição. Porém, se os dados forem espalhados por várias tabelas ou diversos bancos de dados, você precisará combiná-los. A combinação de dados acontece na página Fonte de dados.

Banco de dados únicoVários bancos de dados
  1. Conecte-se aos seus dados. Isso cria uma fonte de dados.
  2. Arraste uma tabela ou planilha de dados para a tela e libere-a.
  3. Arraste uma segunda tabela ou planilha para a tela e libere-a. Uma noodle será formada, indicando que uma relação automática foi formada, ou a caixa de diálogo Editar relação será aberta, solicitando que você informe ao Tableau em qual campo essas tabelas relacionam as duas tabelas.
  4. Continue adicionando tabelas.
  1. Conecte-se aos seus dados. Isso cria uma fonte de dados.
  2. Arraste uma tabela ou planilha de dados para a tela e libere-a.
  3. Depois de trazer a primeira tabela de dados, clique no link Adicionar à direita do título Conexões no painel esquerdo.
  4. Alterne entre as conexões de dados no painel esquerdo e arraste a tabela desejada para a tela e libere-a. Uma noodle será formada, indicando que uma relação automática foi formada, ou a caixa de diálogo Editar relação será aberta, solicitando que você informe ao Tableau em qual campo essas tabelas relacionam as duas tabelas.
  5. Continue adicionando tabelas, alternando entre conexões de dados conforme relevante.

Observação: para relacionar tabelas em diferentes bancos de dados, elas devem ser adicionadas como conexões de dados na mesma fonte de dados, e não em uma nova fonte de dados. As conexões de dados são adicionadas a partir do link Adicionar no painel esquerdo. Novas fontes de dados podem ser criadas a partir do menu Dados ou do menu suspenso no ícone ao lado do nome da Fonte de dados, como visto na imagem abaixo.

Métodos de combinação de dados

As relações são a forma padrão de combinar dados no Tableau. As relações são uma forma dinâmica e flexível de combinar dados de várias tabelas para análises. Se necessário, também é possível fazer uniões de linhas e de colunas nas tabelas. As fontes de dados também podem ser combinadas. Vamos dar uma olhada nas opções de como os dados podem ser combinados no Tableau e algumas das situações em que cada método é útil.

 

RelaçõesEstabelecem o potencial das uniões de colunas entre duas tabelas com base em campos relacionados. Não mesclam dados para criar uma nova tabela fixa. Durante a análise, consultam as tabelas relevantes automaticamente usando as uniões de colunas contextualmente apropriadas para gerar uma tabela personalizada de dados para essa análise.

Mantêm o nível adequado de detalhe, não perde dados, mantém agregações apropriadas e lida com nulos.

Uniões de colunasMesclam duas tabelas de dados com base em uma cláusula de união e um tipo de união de colunas para formar uma nova tabela fixa de dados. Muitas vezes, usadas para adicionar novas colunas de dados na mesma estrutura básica da linha.

Podem causar perda de dados com alguns tipos de união de colunas caso os campos não estejam presentes em todas as tabelas. Podem causar a duplicação de dados se os campos estiverem em diferentes níveis de detalhe.

Uniões de linhasMesclam duas ou mais tabelas de dados para formar uma nova tabela fixa de dados. Usadas para anexar (adicionar novas linhas de) dados na mesma estrutura básica da coluna.
CombinaçõesTrabalham em duas ou mais fontes de dados separadas do Tableau. Os dados permanecem separados. O Tableau consulta as fontes de dados de forma independente e visualiza os resultados na exibição, com base nos campos de vinculação estabelecidos para essa planilha. Imitam o comportamento de uma união de colunas à esquerda e podem filtrar dados de fontes de dados secundárias.

Observação: também é possível combinar dados com o SQL personalizado. Na maioria das vezes, é melhor combinar dados diretamente na tela ou com a combinação de dados. Isso permite ao Tableau a maior flexibilidade para otimização. No entanto, em certos cenários, pode haver razões para usar o SQL personalizado. Tenha em mente que isso pode ter implicações de desempenho porque o Tableau é forçado a executar a instrução do SQL personalizado como escrito.

Relações

A relação é um método para trabalhar com dados de várias tabelas com base em campos compartilhados — colunas — entre essas tabelas. Estabelecer uma relação informa ao Tableau como as linhas podem ser conectadas entre as tabelas. O Tableau mantém essa informação, mas não une imediatamente as linhas, como acontece com uma união de colunas codificada. Em vez disso, quando uma visualização é criada, os campos envolvidos na análise são rastreados através do relacionamento e as uniões de colunas apropriadas são criadas para retornar os dados corretos.

Como os dados nunca são forçados uma única tabela fora do contexto de uma visualização, as relações são úteis quando os dados estão em diferentes níveis de detalhe ou granularidade. Por exemplo, se você precisa trabalhar com dados sobre chuvas diárias em uma tabela, e temperaturas horárias em outra tabela.

Para obter mais informações sobre como combinar tabelas usando relacionamentos, consulte Relacionar os dados

Para obter mais informações sobre como combinar tabelas usando relacionamentos, consulte Relacionar os dados e essas publicações no blog do Tableau:

Observação: no Tableau versão 2024.2 e posterior, o modelo de dados do Tableau oferece suporte à análise de vários fatos e às dimensões compartilhadas por meio de relações multifatoriais. Para obter mais informações, veja Sobre modelos de dados de relação de vários fatos(O link abre em nova janela), Quando usar um modelo de relação de vários fatos(O link abre em nova janela), e Construa um modelo de dados de relação de vários fatos(O link abre em nova janela).

União de colunas

A união de colunas é um método para combinar tabelas relacionadas por campos comuns. O resultado da combinação de dados usando uma união de colunas é uma tabela que se estende horizontalmente ao adicionar colunas de dados.

Para obter mais informações sobre a combinação de dados no Tableau, consulte Unir colunas de dados.

Combinação de dados

Quando você usa a combinação de dados, os dados são combinados em uma fonte de dados primária com campos comuns de uma ou mais fontes de dados secundárias.

A combinação de dados é útil quando você precisa alterar a forma como a fonte de dados é configurada em uma base de planilha por planilha, quando você deseja combinar bancos de dados que não permitem relações ou uniões de colunas como fontes de dados de cubo ou fontes de dados publicadas.

O resultado da combinação de dados é uma tabela virtual que se estende horizontalmente ao adicionar colunas de dados. Os dados de cada fonte de dados serão agregados a um nível comum antes de serem exibidos juntos na visualização.

Para obter mais informações sobre como funciona a combinação de dados e como combinar dados no Tableau, consulte Combinar os dados.

União de linhas

A união de linhas é um método para anexar valores (linhas) a tabelas. Se as tabelas tiverem as mesmas colunas, você poderá uni-las. O resultado da combinação de dados usando uma união é uma tabela virtual com as mesmas colunas, mas se estende verticalmente ao adicionar linhas de dados.

Você pode unir tabelas de duas maneiras: manualmente ou com pesquisa curinga. Para obter mais informações sobre como unir linhas de dados usando um desses métodos no Tableau, consulte Unir linhas de dados.

Considerações para uma fonte de dados do Tableau

Antes de mais nada, certifique-se de entender o propósito da fonte de dados. Criar uma fonte de dados catch-all para uma ampla variedade de usuários com perguntas amplas é diferente de criar uma fonte de dados de nicho otimizada para desempenho. É importante saber seu objetivo desde o início.

Com esse objetivo em mente, existem vários itens a considerar e planejar antes de criar uma fonte de dados no Tableau:

  • Localização e acesso
  • Forma e limpeza
  • O modelo de dados e a combinação de dados
  • Metadados e personalização
  • Escalabilidade, segurança e capacidade de descoberta
  • Desempenho e atualização

Localização e acesso

A localização de seus dados pode ser tão simples quanto um único arquivo do Excel em seu computador ou uma planilha do Google que você criou, ou tão complexa quanto vários bancos de dados usando várias tecnologias. O acesso também pode envolver drivers ou conectores específicos de um banco de dados ou informações de logon para um servidor de banco de dados.

Perguntas a considerar:

Forma e limpeza

Sua organização talvez já tenha dados bem estruturados aos quais você pode se conectar ou processos ETL que podem ser aproveitados; ou talvez precise usar o Tableau Prep Builder para executar operações de limpeza e modelagem para colocar os dados em um formato útil.

Perguntas a considerar:

  • Os dados estão bem estruturados para uso com o Tableau?
  • O Tableau Prep Builder e o Tableau Prep Conductor devem ser usados para limpar e automatizar fluxos de preparação de dados?
  • Quais cálculos ou manipulações seriam melhor executadas nativamente no Tableau?
  • Existem dados desnecessários? Faltam dados?

O modelo de dados e a combinação de dados

O Tableau precisa saber como consultar os dados, que são transmitidos pelo O modelo de dados do Tableau. Se os dados forem provenientes de várias tabelas, os dados deverão ser combinados. Os métodos para combinar dados incluem relações, uniões de colunas, uniões de linhas e combinações.

Perguntas a considerar:

  • Os dados estão espalhados por vários sistemas?
  • Qual é a melhor maneira de combinar cada tabela de dados?

Metadados e personalização

Os dados são muitas vezes armazenados de uma maneira que não é fácil para uma pessoa usar confortavelmente. Por exemplo, os nomes de campo padrão podem ser complicados; a formatação personalizada pode ser desejada; as definições de abreviaturas ou códigos podem estar faltando; ou cálculos comuns podem não estar presentes nos dados subjacentes. Criar uma camada semântica com essas informações pode tornar os dados muito mais fáceis de entender e usar.

Perguntas a considerar:

  • Quais cálculos devem ser adicionados?
  • Os nomes de tabela e de campo são compreensíveis?
  • As configurações padrão dos campos são úteis ou devem ser personalizadas?
  • Existem ajustes que devem ser feitos para respaldar o Tableau Catalog?
    Observe que o Explique os dados não aceita fontes de dados de várias tabelas no momento.

Escalabilidade, segurança e capacidade de descoberta

Uma fonte de dados pode permanecer na pasta de trabalho onde foi criada, uma fonte de dados inserida, ou pode ser publicada no Tableau Server ou no Tableau Cloud, independentemente de qualquer análise como um ativo de conteúdo próprio. Essa centralização das fontes de dados publicadas tem o benefício adicional de segurança e dimensionamento, permitindo que vários usuários acessem uma fonte de dados consistente. As fontes de dados publicadas também podem usar o Tableau Catalog e as recomendações, além de fornecer uma única fonte de verdade para uma organização.

Perguntas a considerar:

  • A fonte de dados deve permanecer inserida na pasta de trabalho?

(As perguntas a seguir supõem que a fonte de dados foi publicada)

Desempenho e atualização

Além disso, as fontes de dados do Tableau podem ser conexões em tempo real com os dados de origem, ou os dados podem ser copiados como uma extração atualizável. As extrações podem aumentar o desempenho da análise ou evitar drenagens de recursos em sistemas de banco de dados.

Perguntas a considerar:

Criar fontes de dados de qualidade

Há muita coisa que entra em uma fonte de dados bem projetada e com bom desempenho. Você não precisa publicar sua primeira tentativa. Como a criação de uma boa visualização, criar uma fonte de dados pode ser um processo contínuo. Tente combinar os dados que você acha que precisa e, em seguida, crie a visualização desejada. Você sempre pode voltar e escrever um novo cálculo ou trazer outra tabela de dados. Faça alguns testes de usuário e pergunte a um colega se ele pode descobrir seus nomes de campo.

Claro, é melhor publicar apenas as fontes de dados em que você confia e apenas certificar aquelas que passaram pela garantia de qualidade. Quando sua fonte de dados estiver na frente dos usuários, eles deverão confiar nela.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!