Análise com a segunda data no Tableau Desktop

Esta é a segunda etapa do tutorial e assume que a primeira etapa, Encontrar a Segunda data com o Tableau Prep, já foi concluída.

Na primeira etapa, pegamos nosso conjunto de dados original e o moldamos para responder às perguntas a seguir:

  1. Qual foi a duração em dias entre a primeira e a segunda infração de cada motorista?

  2. Compare os valores das multas da primeira e da segunda infração. Elas estão correlacionadas?

  3. Qual motorista pagou mais no total? Quem pagou menos?

  4. Quantos motoristas tinham vários tipos de infrações?

  5. Qual foi o valor médio da multa para os motoristas que nunca fizeram autoescola?

Enquanto analisamos essas perguntas, torna-se claro que há alguns prós e contras na primeira estrutura de dados criada. Voltaremos ao Tableau Prep Builder e faremos uma reformulação adicional, depois veremos como isso influencia a mesma análise no Tableau Desktop. Finalmente, veremos uma abordagem, apenas para o Tableau Desktop, à análise por meio de expressões de nível de detalhe (LOD) com os dados originais.

A meta deste tutorial é apresentar vários conceitos no contexto de um cenário da vida real e trabalhar com as opções, sem estabelecer uma que seja a melhor de maneira prescritiva. Ao fim, você deve entender melhor como a estrutura de dados influencia os cálculos e as análises, assim como obter uma maior familiaridade com vários aspectos do Tableau Prep e dos cálculos no Tableau Desktop.

Observação: para completar as tarefas neste tutorial, é necessário ter o Tableau Prep Builder e, opcionalmente, o Tableau Desktop instalados e os dados já baixados.

Para instalar o Tableau Prep e o Tableau Desktop antes de continuar com este tutorial, consulte o Guia de implantação do Tableau Desktop e do Tableau Prep(O link abre em nova janela). Caso contrário, é possível baixar as versões gratuitas de avaliação do Tableau Prep(O link abre em nova janela) e do Tableau Desktop(O link abre em nova janela).

O conjunto de dados é o resultado de Driver Infractions.tflx, conforme criado na primeira etapa.

Análise no Tableau Desktop

Depois de configurar os dados, vamos trazê-los para o Tableau Desktop. Algumas perguntas podem ser respondidas facilmente, mas outras envolvem alguns (ou muitos) cálculos. Tente responder às perguntas abaixo, é possível expandir cada uma delas para obter informações básicas sobre como proceder se você não conseguir seguir adiante.

Observação: você pode baixar a pasta de trabalho Driver Infractions.twbx(O link abre em nova janela) para considerar as soluções dentro do contexto. Lembre-se de que pode haver maneiras alternativas de interpretar a análise ou de chegar às respostas.

1. Qual foi a duração em dias entre a primeira e a segunda infração de cada motorista?
2. Compare os valores das multas da primeira e da segunda infração. Elas estão correlacionadas?
3. Qual motorista pagou mais no total? Quem pagou menos?
4. Quantos motoristas tinham vários tipos de infrações?
5. Qual foi o valor médio da multa para os motoristas que nunca fizeram autoescola?

Vá além—Dados dinamizados

Embora os dados com que estivemos trabalhando fossem bem estruturados para abordar perguntas específicas a respeito da primeira e da segunda infração, essa não é a estrutura padrão recomendada para uso com o Tableau Desktop. Quanto mais a nossa análise diverge das perguntas básicas com relação às datas das infrações, mais complicados nossos cálculos se tornam para combinar as informações relevantes em uma forma útil.

Usualmente, quando os dados são armazenados com várias colunas para o mesmo tipo de dados (como duas colunas para data, duas colunas para o valor da multa, entre outros) e informações únicas são armazenadas no nome do campo (como se é a primeira ou a segunda infração), isso é uma indicação de que os dados devem estar dinamizados.

Realizar várias tabelas dinâmicas no Tableau Prep Builder pode lidar com isso muito bem. Podemos trabalhar no final do fluxo do Tableau Prep para Infração de motorista criado no tutorial anterior Encontrar a Segunda data com o Tableau Prep.

Dica: certifique-se de que tenha voltado ao Tableau Prep para os próximos passos.

  1. Na última etapa de limpeza, adicione uma etapa de dinamização que dinamiza todos os campos duplicados. Use o ícone de mais no canto superior direito da área Campos dinamizados para adicionar mais Valores dinâmicos. Cada conjunto de campos (como Valores da primeira e segunda multas) deve ser dinamizado junto.

    Para obter mais informações sobre tabela dinâmica, consulte Limpar e formatar dados.

  2. Na área Campos dinamizados, sob a coluna Nomes da tabela dinâmica1, clique duas vezes em cada valor e renomeie-os para 1º e 2º lugar.

    Painel de configuração da Tabela dinâmica 1 no Tableau Prep mostrando as cinco tabelas dinâmicas

Os resultados podem ser limpos ao remover datas nulas assim como ao renomear e reordenar campos.

  1. Adicione uma etapa de limpeza após a dinamização. Na coluna Data da infração, clique com o botão direito do mouse na barra de nulos e escolha Excluir.

  2. Clique duas vezes no nome de campo Pivot1 Names e renomeie-o Número da infração.

  3. Arraste campos como apropriado para reordená-los como abaixo:

    Visualização dos dados dinamizados e limpos

  1. A partir dos novos dados dinâmicos, crie um resultado chamado Infrações dinamizadas do motorista e traga-o para o Tableau Desktop. (Não se esqueça de executar o fluxo após adicionar a etapa de Saída.)

Agora podemos considerar as nossas cinco perguntas novamente com essa estrutura de dados dinamizada; é possível expandir cada uma para obter informações básicas sobre como proceder se você não conseguir seguir adiante.

Observação: é possível baixar o arquivo de fluxo completo Pivoted Driver Infractions.tflx para verificar o seu trabalho ou baixar a pasta de trabalho Pivoted Driver Infractions.twbx para considerar as soluções dentro do contexto. Lembre-se de que pode haver maneiras alternativas de interpretar a análise ou de chegar às respostas.

1. Qual foi a duração em dias entre a primeira e a segunda infração de cada motorista?
2. Compare os valores das multas da primeira e da segunda infração. Elas estão correlacionadas?
3. Qual motorista pagou mais no total? Quem pagou menos?
4. Quantos motoristas tinham vários tipos de infrações?
5. Qual foi o valor médio da multa para os motoristas que nunca fizeram autoescola?

Vantagens dos dados dinamizados

Poderíamos continuar com a estrutura de dados original do tutorial se soubéssemos que apenas precisaríamos responder perguntas fáceis de responder com essa estrutura. No entanto, o formato de dados dinamizado é mais flexível. Mesmo que ele requeira alguns cálculos, uma vez que eles estejam em ação o conjunto de dados resultante é bem adequado para responder a perguntas mais amplas.

Vá mais além—Somente cálculos

E se você não tiver acesso ao Tableau Prep Builder? Você está totalmente sem sorte se estiver preso aos dados originais? De maneira alguma!

O Tableau Desktop e as expressões de LOD podem responder a todas as nossas perguntas de análise. Se nos conectarmos a Traffic Violations.xlsx(O link abre em nova janela) original, a sua aparência é muito similar ao conjunto de dados dinamizados—apenas sem o campo essencial Número da infração. Precisaremos imitar o resultado das etapas de agregação por meio de expressões de LOD.

Observação: é possível baixar a pasta de trabalho LOD Driver Infractions.twbx(O link abre em nova janela) para considerar as soluções dentro do contexto. Lembre-se de que pode haver maneiras alternativas de interpretar a análise ou de chegar às respostas.

1. Qual foi a duração em dias entre a primeira e a segunda infração de cada motorista?
2. Compare os valores das multas da primeira e da segunda infração. Elas estão correlacionadas?
3. Qual motorista pagou mais no total? Quem pagou menos?
4. Quantos motoristas tinham vários tipos de infrações?
5. Qual foi o valor médio da multa para os motoristas que nunca fizeram autoescola?

É importante lembrar que esta solução tem muitos cálculos aninhados e expressões de LOD. Dependendo do tamanho do conjunto de dados e da complexidade dos dados, o desempenho pode ser prejudicado.

Reflexão sobre métodos

Que caminho você deve seguir? Isso só depende de você e das ferramentas a sua disposição.

  • Se desejar ficar longe de LODs, há uma solução de formação de dados, embora cálculos possam ser necessários para algumas análises (Análise no Tableau Desktop).

  • Se é possível formar os dados e você se sente confortável em fazer cálculos—inclusive LODs—a segunda opção oferece a maior flexibilidade (Vá além—Dados dinamizados).

  • Se você se sente confortável com LODs, há uma influência mínima no desempenho e/ou você não tem acesso ao Tableau Prep, resolver isso apenas com LODs é uma opção viável (Vá mais além—Somente cálculos).

No mínimo, valer a pena entender como a agregação no Tableau Prep e as expressões de nível de detalhe no Tableau Desktop estão interrelacionadas e influenciam na análise de dados. Assim como na maioria das vezes no Tableau, há mais de uma maneira de se fazer o que for necessário. Explorar todas as várias opções pode ajudar a reunir conceitos e permitir que você escolha a melhor solução para você.

Os cálculos usaram:

Observação: agradecimento especial ao tópico do Workout Wednesday da Ann Jackson Os clientes gastam mais na primeira ou na segunda compra?(O link abre em nova janela) e a dica para o Tableau Prep do Andy Kriebel Retornar a primeira e a segunda data de compra(O link abre em nova janela), que forneceram a inspiração inicial para este tutorial. Clicar nestes links o levará para fora do site do Tableau. A Tableau não pode ser responsabilizada pela exatidão ou pela atualidade de páginas mantidas por provedores externos. Entre em contato com os proprietários se você tiver dúvidas a respeito do conteúdo deles.