Dicas para trabalhar com seus dados

Os dados podem ser organizados em diversas formas. Para aproveitar o Tableau Desktop, o Tableau recomenda que você se conecte a dados formatados para análise. Especificamente, os dados:

  • o mais granular possível, em vez de agregado (como dados diários de clima em ver de médias mensais)

  • organizados como uma tabela de banco de dados (em vez de uma tabela em colunas, como uma tabela cruzada)

  • sem informações irrelevantes (tudo que não se encontra nos dados e em seus cabeçalhos)

Quando os dados são estruturados para análise, é mais fácil fazer e responder perguntas. O Tableau pode agregar dados brutos ao nível desejado, em vez de estar restrito às agregações existentes nos dados. Os grupos e hierarquias podem ser criados conforme necessário, e os cálculos podem ser executados no fluxo da análise.

O Tableau Desktop tem opções básicas de limpeza e o Interpretador de dados. O Tableau Prep pode ser necessário para problemas de formatação mais complexos.

As seções a seguir, específicas do Tableau Desktop, destacam e fornecem sugestões para resolver algumas formatações ou problemas comuns que podem dificultar a análise dos dados.

Dinamizar dados em formato de tabela de referência cruzada

Quando os dados são formatados como no formato de tabela de referência cruzada, a tabela é orientada por coluna. Em uma tabela orientada por coluna, as variáveis são armazenadas como cabeçalhos de colunas. No entanto, o Tableau Desktop é otimizado para dados orientados por linhas. Em uma tabela orientada por linhas, as variáveis são armazenadas nos valores da linha.

Por exemplo, suponha que você tenha uma tabela orientada por coluna, que mostra as pontuações de matemática, ciências e história dos alunos da escola.

Tabela de tabulação cruzada mostrando número de identificação do aluno, sexo, região da escola e três disciplinas escolares (matemática, ciências e história) para três alunos. As colunas de disciplinas escolares são destacadas em laranja claro.

O Tableau Desktop é otimizado para se conectar à tabelas orientadas por linhas, onde os valores de matemática, ciências e história estão organizados em uma coluna chamada "Assunto" e as pontuações para cada aluno estão organizadas em uma coluna chamada "Pontuação". É possível dinamizar as colunas em linhas, editando manualmente os dados do Excel. Como alternativa, conecte-se aos dados do Excel no Desktop e, em seguida, use a opção para dinamizar. Para obter mais informações sobre a opção para dinamizar, consulte Dinamizar dados de colunas para linhas.

Exemplo de tabela dinâmica de tabulação cruzada mostrando número de identificação do aluno, gênero, região da escola, disciplina e pontuação.

Remover dados pré-agregados

Os dados muitas vezes podem vir pré-agregados. Ou seja, os dados podem conter somas, médias, medianas, etc. Um exemplo comum de dados pré-agregados vem na forma de subtotais e totais gerais. Os dados de subtotais e totais gerais são calculados de dados brutos, mas não fazem parte dos próprios dados brutos.

Por exemplo, suponha que você tenha uma tabela que contém uma linha de informações de subtotais.

Tabela de tabulação cruzada mostrando número de identificação do aluno, sexo, região da escola e três disciplinas escolares (matemática, ciências e história) para cinco alunos. Há uma linha de subtotais destacada em laranja claro na parte inferior da tabela, mostrando a soma das pontuações dos alunos em cada disciplina.

Neste caso, os dados pré-agregados precisam ser removidos. Para usar subtotais e totais gerais em sua análise, remova manualmente este tipo de informação da tabela. Em seguida, conecte-se aos dados do Excel no Desktop e calcule os subtotais e totais usando a opção de totais. Para obter mais informações, consulte Exibir totais em uma visualização. Como alternativa, conecte-se aos dados do Excel no Desktop, ative o Interpretador de dados e, em seguida, use a opção de totais. Para obter mais informações, consulte Limpar dados do Excel, CSV, PDF e do Planilhas Google com o Interpretador de dados.

Tabela de tabulação cruzada mostrando número de identificação do aluno, sexo, região da escola e três disciplinas escolares (matemática, ciências e história) para cinco alunos. Há uma linha de subtotais destacada em laranja claro na parte inferior da tabela, mostrando a soma das pontuações dos alunos em cada disciplina, e a linha está riscada em vermelho.

Remover ou excluir texto introdutório

Os dados do Excel que são fornecidos como um relatório podem conter títulos ou blocos de texto introdutório. Como o Desktop espera cabeçalhos de coluna ou valores de linha na primeira linha de uma tabela, estas informações podem causar problemas durante a análise.

Por exemplo, suponha que você tenha uma tabela que contém um título e uma data de relatório.

Exemplo de tabela de tabulação cruzada com detalhes no canto superior destacados em laranja claro com os dizeres "Relatório do Excel, janeiro de 2017".

Neste caso, as informações de título e data precisam ser removidas. Para usar um título e uma data para um relatório, siga um destes procedimentos:

  • Remova manualmente estas informações dos dados do Excel. Em seguida, conecte-se aos dados do Excel no Desktop e adicione um título de relatório usando a opção de título. Para obter mais informações, consulte Formatar partes individuais da exibição.
  • Conecte-se aos dados do Excel no Desktop, ative o Interpretador de dados e use a opção de título. Para obter mais informações, consulte Limpar dados do Excel, CSV, PDF e do Planilhas Google com o Interpretador de dados.
  • Se não puder remover essas informações dos dados do Excel, crie um intervalo nomeado e conecte-se a ele do Desktop. Para obter mais informações, consulte Excel.

Exemplo de tabela de tabulação cruzada com detalhes desnecessários no canto superior riscado em vermelho. Esses detalhes dizem "Relatório Excel, janeiro de 2017".

Achatar cabeçalhos hierárquicos em uma única linha

Em geral, o Tableau Desktop espera que somente a primeira linha nos dados do Excel contenham cabeçalhos de coluna. Os dados que contêm várias camadas de cabeçalhos de coluna podem causar problemas durante a análise.

Por exemplo, suponha que você tenha uma tabela que contém um cabeçalho principal e vários subcabeçalhos.

Tabela de tabulação cruzada mostrando número de identificação do aluno, sexo, região da escola e três disciplinas escolares (matemática, ciências e história) para quatro alunos. Há um cabeçalho de tabela que diz "Califórnia" destacado em laranja claro na parte superior da tabela.

Neste caso, a hierarquia dos cabeçalhos deve ser nivelada ou removida. Para fazer isso, crie manualmente uma nova coluna para cada cabeçalho na hierarquia, diretamente nos dados do Excel. Como alternativa, conecte-se aos dados do Excel no Tableau Desktop e, em seguida, ative o Interpretador de dados. Verifique se os cabeçalhos estão nivelados corretamente. Para obter mais informações sobre o Interpretador de dados, consulte Limpar dados do Excel, CSV, PDF e do Planilhas Google com o Interpretador de dados.

Tabela de tabulação cruzada que exibe IDs de alunos, estados, gêneros, escolas e notas de testes. A coluna Estado é destacada em verde claro.

Verificar se não há células em branco

Ao criar novas colunas para os cabeçalhos hierárquicos, verifique se cada célula nas novas colunas contém valores.

Exemplo de tabela dinâmica de tabulação cruzada mostrando número de identificação do aluno, gênero, região da escola, disciplina e pontuação. A coluna Estado é destacada em laranja claro e, das dez linhas totais na coluna, há texto em apenas oito.

Embora seja possível repetir o mesmo valor para cada linha, é importante que ela contenha os dados que a associam aos dados armazenados no cabeçalho hierárquico. Remova manualmente as células em branco dos dados do Excel.

Exemplo de tabela dinâmica de tabulação cruzada mostrando número de identificação do aluno, gênero, região da escola, disciplina e pontuação. A coluna Estado é destacada em verde claro, e há estados preenchidos em cada uma das dez linhas.

Remover linhas em branco

Verifique se não há linhas em branco nos dados. Para corrigir as linhas em branco, você deve removê-las dos dados do Excel.

Exemplo de tabela dinâmica de tabulação cruzada mostrando número de identificação do aluno, gênero, região da escola, disciplina e pontuação. Há duas linhas em branco destacadas em laranja claro.

Adicionar cabeçalhos não encontrados

Verifique se não há cabeçalhos de coluna ausentes. Para corrigir os cabeçalhos ausentes, é necessário adicioná-los manualmente, diretamente aos dados do Excel.

Exemplo de tabela dinâmica de tabulação cruzada mostrando número de identificação do aluno, gênero, região da escola, disciplina e pontuação. Há dois cabeçalhos de coluna em branco destacados em laranja claro.