Introdução ao Tableau Prep Builder

Observação: o Tableau Prep versão 2019.1.2 mudou seu nome para Tableau Prep Builder. Se estiver usando uma versão anterior, ainda verá "Tableau Prep" no produto.

Este tutorial introduz as operações usuais disponíveis no Tableau Prep Builder. Usando os conjuntos de dados de amostra do Tableau Prep Builder, você será guiado pela criação de um fluxo para o Sample - Superstore. Este tutorial usa a versão mais atual do Tableau Prep Builder. Caso esteja usando uma versão anterior, seus resultados podem ser diferentes.

Assista às dicas de todo o processo para receber informações sobre como o Tableau Prep Builder o ajuda a limpar e formatar seus dados para análise.

Para instalar o Tableau Prep Builder antes de prosseguir com este tutorial, consulte Instalar o Tableau Desktop ou o Tableau Prep Builder usando a interface do usuário(Link opens in a new window) no Guia de implantação do Tableau Desktop e do Tableau Prep Builder. Como alternativa, você pode baixar a avaliação gratuita(Link opens in a new window).

Arquivos de amostra

Para concluir as tarefas deste tutorial é preciso instalar o Tableau Prep Builder, além de baixar os arquivos de dados do Sample Superstore em um local único:

Você também pode encontrar os arquivos no seguinte local do seu computador após instalar o Tableau Prep Builder:

  • (Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
  • (Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files
  • Esta é a história...

    Você trabalha na sede de uma grande rede varejista. Seu chefe deseja analisar as vendas do produto e os lucros da empresa dos últimos quatro anos. Você sugere que ele use o Tableau Desktop para isso. Ele acha uma ótima ideia e quer que você comece logo a tarefa.

    Conforme começa a juntar os dados necessários, você percebe que eles foram coletados e monitorados de forma diferente para cada região. Além disso, você percebe muitas entradas de dados criativos nos diversos arquivos, e que uma região possui até mesmo um arquivo separado para cada ano!

    Antes que possa começar a analisar os dados no Tableau será necessário limpá-los antes. Será uma longa noite.

    Ao procurar por menus de restaurantes para pedir sua refeição, você se lembra de que o Tableau lançou recentemente um novo produto chamado Tableau Prep Builder, que pode ajudá-lo com a difícil tarefa de limpeza de dados.

    Você assina uma avaliação gratuita(Link opens in a new window) e decide tentar.

    1. Conectar a dados

    A primeira tela que você vê ao abrir o Tableau Prep Builder é uma página inicial com um painel Conexões, igual ao Tableau Desktop.

    Para começar, a primeira etapa é se conectar aos dados e criar uma etapa de entrada. Nela, você começa a criar um fluxo de trabalho ou “fluxo”, como é chamado no Tableau Prep Builder, e a adicionar mais etapas para serem executadas nos dados conforme prossegue.

    Dica: a etapa de entrada é um ponto de inserção de dados e o ponto inicial do fluxo. É possível ter várias etapas de entrada e algumas podem incluir vários arquivos de dados. Para obter mais informações sobre como se conectar a dados, consulte Conectar a dados(Link opens in a new window).

    Os arquivos de dados de vendas de diferentes regiões são armazenados em formatos diferentes e os pedidos do Sul são, na verdade, vários arquivos. Você dá uma olhada no painel Conexões e vê que há várias alternativas para se conectar aos dados. Ótimo!

    Como as outras regiões têm apenas um arquivo para todos dados de quatro anos, você decide tratar os arquivos do Sul antes.

    1. No painel Conexões, clique no botão Adicionar conexão.

    2. Os arquivos estão no formato .csv, então selecione Arquivo de texto na lista de conexões.

    3. Navegue até o diretório dos arquivos, selecione o primeiro arquivo orders_south_2015.csv e clique em Abrir para adicioná-lo ao fluxo. (Para obter a localização do arquivo, consulte Conclusão e recursos.)

      Depois de se conectar ao primeiro arquivo, a área de trabalho do Tableau Prep Builder é aberta e você pode perceber que é dividida em duas seções principais. O painel Fluxo na parte superior e o painel Entrada na inferior.

      No Tableau Prep Builder, o painel Fluxo é a área de trabalho, como o Tableau Desktop, onde pode interagir com os dados visualmente e criar seu próprio fluxo. O painel Entrada contém opções de configuração de como os dados são inseridos. Também mostra os campos, tipos de dados e exemplos de valores do conjunto de dados.

      Veremos como vai interagir com esses dados na próxima seção.

      Dica: em tabelas únicas, o Tableau Prep Builder cria automaticamente uma etapa de entrada no painel Fluxo ao adicionar dados ao fluxo. Como alternativa, você pode usar o recurso de arrastar e soltar para adicionar tabelas ao painel Fluxo.

    4. Há três outros arquivos de pedidos no Sul. Você poderia adicionar cada arquivo individualmente, mas deseja agrupar todos eles em uma etapa de entrada, então clica na guia Vários arquivos no painel Entrada.

    5. Você vê uma opção de União de linhas curinga. Selecione-a.

      Você percebe que o diretório onde selecionou seu arquivo já foi preenchido e que os outros arquivos necessários foram listados na seção Arquivos incluídos no painel Entrada.

      Dica: usar uma união curinga é uma ótima forma de conectar e combinar vários arquivos de uma única fonte de dados com nome e estrutura semelhantes. Para usar essa opção, os arquivos devem estar no mesmo diretório principal ou secundário. Caso não veja os arquivos que precisa imediatamente, altere o critério de pesquisa. Para obter mais informações, consulte Unir arquivos e tabelas de banco de dada na etapa de entrada(Link opens in a new window).

    6. Clique em Aplicar para adicionar os dados desses arquivos à etapa de entrada orders_south_2015.

    7. Os arquivos das outras regiões são arquivos de tabela única, então é possível selecionar todos de uma vez e adicioná-los ao fluxo.

    8. Abra o Pesquisador ou Localizador de arquivos e navegue até o diretório dos arquivos. Pressione Ctrl ou Cmd e clique (MacOS) para selecionar os arquivos a seguir e arraste e solte-os no painel Fluxo para adicioná-los ao fluxo. (Para obter a localização do arquivo, consulte Conclusão e recursos.)

      • Orders_Central.csv
      • Orders_East.xlsx
      • Orders_West.csv

      Observação: há diferentes tipos de arquivo. Caso você não veja todos esses arquivos, garanta que o seu navegador ou descobridor de arquivos está definido como visualizar todos os tipos de arquivo.

    Verifique seu trabalho: veja “Conectar a dados” em ação

    Clique na imagem para reproduzi-la

    2. Explorar seus dados

    Agora que tem os arquivos de dados carregados no Tableau Prep Builder, você tem certeza de que deseja combinar todos os arquivos. Mas antes de fazer isso, pode ser uma boa ideia analisá-los e ver se encontra algum problema.

    Ao selecionar uma etapa de entrada no painel Fluxo, você poderá ver as configurações usadas para trazer os dados, os campos incluídos e alguns valores de amostra.

    Esse é um bom momento para decidir quantos dados deseja incluir no fluxo e remover ou filtrar os campos que não deseja. Além disso, é possível alterar quaisquer tipos de dados que foram atribuídos incorretamente.

    Dica: se estiver trabalhando com grandes conjuntos de dados, o Tableau Prep Builder trará automaticamente uma amostra dos dados para melhorar o desempenho. Caso não veja os dados esperados, pode ser necessário ajustar a amostra. Você pode fazer isso na guia Amostra de dados. Para obter mais informações sobre as opções de configuração de dados e o tamanho da amostra, consulte Definir o tamanho da amostra de dados(Link opens in a new window).

    No painel Fluxo, ao selecionar cada etapa e analisar cada conjunto de dados, você percebe algumas coisas que desejará alterar posteriormente e uma coisa que deseja corrigir agora na etapa de Entrada.

    • No painel Fluxo, clique na etapa de entrada Orders_Central para selecioná-la. No painel Entrada, você observa os problemas a seguir:

      • As datas de pedido e de envio estão separadas em campos para mês, dia e ano.

      • Alguns dos campos possuem tipos de dados diferentes dos mesmo campos em outros arquivos.

      • Não há um campo para Região.

      Você precisará limpar esses campos antes de agrupar esse arquivo aos outros. Mas não é possível corrigir isso nesta etapa de Entrada, então você faz uma anotação para corrigir posteriormente.

    • Selecione a etapa de entrada Orders_East.

      Os campos neste arquivo parecem ter se alinhado bem com os outros. Mas os valores de Vendas parecem ter o código da moeda incluso. Também será necessário corrigir isso.

    • Selecione a etapa de entrada Orders_West. Também há alguns problemas neste arquivo.

      • O campo Estado usa abreviações do nome de estado. Outros arquivos escrevem o nome completo, então será necessário corrigir isso posteriormente.

      • Há muitos campos que começam com Right_. Esses campos parecem duplicatas de outros campos. Você não deseja incluí-las no fluxo. Isso é algo que pode ser corrigido na etapa de Entrada:

        Para corrigir agora, desmarque a caixa de seleção de todos os campos que começam com Right_. Isso instrui que o Tableau Prep Builder ignore esses campos e não os inclua no fluxo.

        Dica: ao realizar operações de limpeza em uma etapa, como remover campos, o Tableau Prep Builder rastreia as suas alterações no painel Alterações e adiciona uma anotação (no formato de um ícone pequeno) no painel Fluxo para ajudá-lo a acompanhar as ações que você toma em relação aos seus dados. Para etapas de entrada, uma anotação também é adicionada a cada campo.

        No Tableau Prep Builder versão 2018.3.1 e posteriores, as operações de limpeza estão disponíveis na maioria das etapas do fluxo. Em versões anteriores, a maioria das operações de limpeza deve ser realizada em uma etapa de limpeza.

    Agora que identificou os problemáticos nos conjuntos de dados a próxima etapa é examinar os dados com mais cuidado e limpar qualquer problema encontrado, para que possa agrupar e formatar os dados, além de gerar um arquivos de saída que possa usar para análise.

    3. Limpar seus dados

    No Tableau Prep Builder, examinar e limpar os dados é um processo iterativo. Após decidir com qual conjunto de dados deseja trabalhar, a próxima etapa é examinar e agir nesses dados ao aplicar várias operações de limpeza, formatação e agrupamento neles. Você aplica essas operações adicionando etapas ao fluxo. Para obter mais informações sobre as opções de limpeza no Tableau Prep Builder, consulte Limpar e formatar dados(Link opens in a new window)

    Dependendo do que esteja tentando fazer, as etapas são diversas. Por exemplo, adicione uma etapa de limpeza a qualquer momento para aplicar operações de limpeza nos campos como filtrar, mesclar, dividir, renomear, entre outros. Adicione uma etapa de agregação para agrupar e agregar campos e alterar o nível de detalhe dos dados. Para obter mais informações sobre os diferentes tipos de etapa e seus usos, consulte Criar e organizar o fluxo(Link opens in a new window).

    Dica: ao adicionar etapas ao fluxo, uma linha de fluxo é adicionada automaticamente para conectar as etapas umas às outras. É possível mover essas linhas de fluxo e removê-las ou adicioná-las conforme necessário.

    Ao executar o fluxo, esses pontos de conexão são solicitados, para que o Tableau Prep Builder saiba quais etapas estão conectadas e em qual ordem elas são aplicadas ao fluxo. Se a linha de fluxo estiver ausente, o fluxo será quebrado e resultará em erro.

    Limpar Orders_Central

    Para solucionar os problemas observados anteriormente e identificar qualquer outro, comece adicionando uma etapa de limpeza à etapa de entrada Orders_Central.

    1. No painel Fluxo, selecione Orders_Central, clique no ícone de adição e adicione uma etapa de limpeza. Dependendo da sua versão, essa opção de menu é Adicionar etapa, Adicionar etapa de limpeza ou Etapa de limpeza.

      Após adicionar uma etapa de limpeza ao fluxo, a área de trabalho é alterada e você vê os detalhes dos dados.

      A. Painel Fluxo, B. Barra de ferramentas, C. Painel Perfil, D. Grade de dados

      A área de trabalho agora está dividida em três partes: o painel Fluxo, o painel Perfil com uma barra de ferramentas e a grade de Dados.

      O painel Perfil mostra a estrutura dos dados, resumindo os valores de campo em compartimentos, para que possa ver rapidamente valores relacionados e identificar exceções e valores nulos. A grade de Dados mostra o detalhe de nível de linha dos campos.

      Dica: cada campo do painel Perfil é mostrado em um cartão de perfil. Use o menu Mais opções (seta suspensa em versões anteriores) em cada cartão para ver e selecionar as diferentes opções de limpeza disponíveis para esse tipo de campo. Além disso, é possível classificar os valores de campo, alterar o tipo de dados, atribuir uma função de dados ao campo ou arrastar e soltar os cartões de perfil e as colunas na grade de Dados para reorganizá-los.

      Limpar dados com campos calculados

      Este conjunto de dados não tem o campo Região. Como os outros conjuntos de dados têm esse campo, será necessário adicioná-lo para que possa agrupar os dados posteriormente. Será necessário usar um campo calculado para isso.

    2. Na barra de ferramentas, clique em Criar campo calculado.

    3. No editor de Cálculo, nomeie a Região do campo calculado.. Em seguida, insira "Central" (incluindo as aspas) e clique em Salvar.

      Você adora a flexibilidade de poder usar campos calculados para formatar os dados. Está contente em ver que o Tableau Prep Builder usa o mesmo idioma do editor de cálculo que o Tableau Desktop.

      Dica: ao fazer alterações nos campos e valores, o Tableau Prep Builder os monitora no painel Alterações. Um ícone (anotação) representando a alteração também é adicionado à etapa de limpeza no fluxo e ao campo no painel Perfil. Veremos o painel Alterações após fazer mais alterações.

      Em seguida, você deseja tratar os campos de datas de pedido e de envio separados. Você deseja agrupá-los em dois campos únicos, um para Data de pedido e outro para Data de envio, para que se alinhem com os mesmos campos dos outros conjuntos de dados. Certificar-se de que as tabelas têm os mesmos campos permitirá que, posteriormente, você as combine usando uma união.

      É possível usar um campo calculado novamente para fazer isso em uma simples etapa.

    4. Na barra de ferramentas, clique em Criar campo calculado para agrupar os campos Ano do pedido, Mês do pedido e Dia do pedido em um só campo com o formato "MM/DD/AAAA".

    5. No Editor de cálculo, nomeie a Data do pedido do campo calculado. Em seguida, insira o cálculo a seguir e clique em Salvar:

      MAKEDATE([Order Year],[Order Month],[Order Day])

      Agora que tem um novo campo para a data do pedido, você deseja remover os campos existentes, como não precisa mais deles.

      Há muitos campos no painel Perfil. Você observa uma caixa de Pesquisa no canto superior direito da barra de ferramentas. Você se pergunta se pode usá-la para encontrar rapidamente os campos que deseja remover. E decide tentar.

    6. No painel Perfil, na caixa de pesquisa, digite Pedido.

      O Tableau Prep Builder rola rapidamente todos os campos com Pedido no nome na exibição. Legal!

    7. Pressione Ctrl ou Cmd e clique (MacOS) para selecionar os campos para Ano do pedido, Mês do pedido e Dia do pedido. Em seguida, clique com o botão direito do mouse nos campos selecionados e selecione Remover (Remover campo nas versões anteriores) no menu para removê-los.

    8. Agora repita as etapas de 4 a 7 acima para criar um campo único de Data do envio. Tente fazer sozinho ou use as etapas acima para ajudá-lo.

      • Na barra de ferramentas, clique em Criar campo calculado para agrupar os campos Ano do envio, Mês do envio e Dia do envio em um só campo com o formato "MM/DD/AAAA".

      • Nomeie o campo calculado Data do envio e insira o cálculo MAKEDATE([Ship Year],[Ship Month],[Ship Day]). Em seguida, clique em Salvar.

      • Remova os campos Ano do envio, Mês do envio e Dia do envio. Pesquise os campos, selecione-os e selecione Remover (Remover campo nas versões anteriores) no menu para remover os campos.

      Dica: o Tableau Prep Builder resume os dados no painel Perfil em compartimentos para ajudá-lo a ver rapidamente o formato dos dados, encontrar exceções, identificar relações entre campos, entre outros.

      Nesse cenário, as datas de pedido e de envio agora podem ser resumidas por ano. Cada compartimento representa um ano de janeiro do ano inicial a janeiro do ano seguinte, adequadamente rotulado. Como há datas de pedido e de envio que caem na segunda metade de 2018 e 2019, obtemos um compartimento para esses dados rotulado com o ano final de 2019 e 2020.

      Para alterar essa exibição para as datas reais, clique no menu Mais opções (seta suspensa em versões anteriores) no cartão Perfil e selecione Detalhe.

      Interagir diretamente com campos para limpar os dados

      Seus dados estão tomando forma. Mas, conforme conclui a remoção de campos adicionais das datas de pedido e de envio, você observa que o campo Descontos apresenta alguns problemas.

      • Ele está atribuído a um tipo de dados de Cadeia de caracteres em vez de Numérico (decimal).

      • Há um valor de campo Nenhum em vez de um valor numérico para nenhum desconto.

      Isso causa um problema ao agrupar os arquivos, então melhor corrigir isso também.

    9. Limpe a pesquisa e insira desc na caixa de pesquisa para encontrar o campo.

    10. Selecione o campo Descontos, clique duas vezes no valor de campo Nenhum e altere-o para o valor numérico 0.

    11. Para alterar o tipo de dados do campo Desconto de Cadeia de caracteres para Número (decimal), clique em Abc e selecione Número (decimal) no menu suspenso.

    12. Finalmente, nomeie a etapa para ajudar a monitorar o que foi feito nela. No painel Fluxo, clique duas vezes no nome da etapa Limpeza 1 e digite Datas de correção/nomes de campo.

    Revisar alterações

    Você fez muitas alterações neste conjunto de dados e agora começa a se preocupar em não se lembrar de tudo o que fez. Ao olhar para o seu trabalho, você vê uma coluna à esquerda do painel Perfil chamada Alterações.

    Você clica na seta para abrí-la e fica contente em ver uma lista de todas as alterações feitas. Ao rolar pelas alterações na lista, observa que pode excluir, editar e até movê-las para alterar a ordem em que eles foram feitas.

    Você adora o fato de poder encontrar facilmente as alterações feitas em qualquer etapa conforme cria o fluxo e faz testa a ordem delas para obter o máximo de seus dados.

    Verifique seu trabalho: veja “Limpar Orders_Central” em ação.

    Clique na imagem para reproduzi-la

    Agora que limpou um arquivo, dê uma olhada nos outros arquivos para ver quais outros problemas precisam ser corrigidos.

    Você decide olhar o arquivo Excel de Orders_East em seguida.

    Limpar Orders_East

    Ao olhar os campos do arquivo Orders_East, a maioria deles parece se alinhar aos outros arquivos, exceto Vendas. Para analisar melhor e ver se há outro problema a ser solucionado, adicione uma etapa de limpeza à etapa de entrada Orders_East.

    1. No painel Fluxo, selecione Orders_East, clique no ícone de adição e adicione uma etapa de limpeza. Dependendo da sua versão, essa opção de menu é Adicionar etapa, Adicionar etapa de limpeza ou Etapa de limpeza.

      Observando o campo Vendas, você pode ver rapidamente que o código de moeda USD foi incluído com os números de venda, e que o Tableau Prep Builder interpretou esses valores de campo como uma cadeia de caracteres.

      Será necessário remover o código de moeda desse campo e alterar o tipo de dados se quiser obter dados de vendas precisos.

      Corrigir o tipo de dados é fácil, você já sabe como fazer isso. Mas há mais de 2.000 linhas exclusivas de dados de vendas e corrigir cada uma individualmente para remover o código de moeda parece uma tarefa complexa.

      Porém, esse é o Tableau Prep Builder, e você decide dar uma olhada no menu suspenso para ver se há uma opção para corrigir isso.

      Ao clicar em Mais opções (seta suspensa em versões anteriores) do campo Vendas, você vê uma opção de menu chamada Limpar e outra opção embaixo dela para remoção de letras. Você decide tentar e ver o que ela faz.

    2. Selecione o campo Vendas. Clique no menu Mais opções (seta suspensa em versões anteriores) e selecione Limpar > Remover letras.

      Nossa! Essa opção de limpeza removeu instantaneamente o código de moeda de todos os campos. Agora só precisa alterar o tipo de dados de Cadeia de caracteres para Numérico (decimal) e este arquivo estará pronto.

    3. Clique no tipo de dados do campo Vendas e selecione Número (decimal) na lista suspensa para alterar o tipo de dados.

    4. O restante do arquivo está correto. Nomeie sua etapa de limpeza para monitorar seu trabalho. Por exemplo, Alterar tipo de dados.

    Em seguida, você olha o último arquivo do Orders_West para ver se há problemas que precisam ser corrigidos.

    Limpar Orders_West

    Ao analisar os campos do arquivo Orders_West, a maioria dos arquivos parecem estar alinhada ao outros, mas você se lembra de ter visto que o campo Estados usou abreviações para os valores em vez de escrever o nome do estado completo. Para agrupar esse arquivo com os outros será necessário corrigir isso. Então você adiciona uma etapa de limpeza à etapa de entrada Orders_West.

    1. No painel Fluxo, selecione Orders_West, clique no ícone de adição e adicione uma etapa de limpeza.

      Role ou use Pesquisar para encontrar o campo Estado. Você vê que todos os valores de nome de estado usam a abreviação. Há apenas 11 valores exclusivos para esse campo. É possível alterar manualmente cada um, mas será que o Tableau Prep Builder tem outra forma de fazer isso?

      Clique no menu Mais opções (seta suspensa em versões anteriores) do campo e veja uma opção chamada Agrupar valores (Agrupar e substituir em versões anteriores). Ao selecioná-la, você vê várias opções:

      • Seleção manual

      • Pronúncia

      • Caracteres usuais

      • Ortografia

      Os nomes de estado não têm a mesma pronúncia, não estão escritos de maneira incorreta e não compartilham os mesmos caracteres, então você decide tentar a opção Seleção manual.

      Dica: você pode clicar duas vezes em um nome de campo ou valor de campo pra editar um valor único. Para editar vários valores, é possível selecionar todos eles e usar a opção do menu de clique com o botão direito Editar valores. Quando quiser mapear um ou mais valores para valores específicos, porém, use a opção Agrupar valores no menu suspenso.
      Para obter mais informações sobre como editar ou agrupar valores, consulte Editar valores de campo(Link opens in a new window).

    2. Selecione o campo Estado. Clique na seta suspensa e selecione Agrupar valores (Agrupar e substituir em versões anteriores) > Seleção manual.

      Um cartão de duas colunas é aberto. Esse é o editor Agrupar valores. A coluna à esquerda mostra os valores de campo atuais e, a à esquerda, os campos disponíveis para mapeamento aos campos da esquerda.

      Você deseja mapear as abreviações de estado para a versão de nome completo, mas não tem esses valores no conjunto de dados Orders_West. Em seguida, se pergunta se pode apenas editar o nome diretamente e talvez adicioná-lo, então decide tentar.

    3. No editor Agrupar valores, no painel à esquerda, clique duas vezes em AZ para destacar o valor e digite Arizona. Em seguida, pressione Enter para adicionar a alteração.

      O Tableau Prep Builder criou um valor mapeado do novo valor Arizona e mapeou automaticamente o valor antigo, AZ, a ele. Ter uma relação mapeada definida para esses valores economizará tempo se tiver mais dados dessa região inseridos dessa forma.

      Dica: é possível adicionar valores de campo que não estão na amostra de dados para definir relações de mapeamento para organizar os dados. Se atualizar sua fonte de dados e novos dados forem adicionados, você poderá adicioná-lo ao mapeamento em vez de corrigir manualmente cada valor.

      Ao adicionar manualmente um valor que não está na amostra de dados, ele será marcado com um ponto vermelho para ajudar na identificação.

    4. Repita essas etapas para mapear cada estado para a versão com o nome completo.

      Abreviação Nome do estado
      AZ Arizona
      CA Califórnia
      CO Colorado
      ID Idaho
      MT Montana
      NM Novo México
      NV Nevada
      OR Oregon
      UT Utah
      WA Washington
      WY Wyoming

      Em seguida, clique em Concluído para fechar o editor Agrupar valores.

      Depois que todos os estados foram mapeados, você olha para o painel Alterações e vê que há apenas uma entrada, em vez de 11.

      Parece que o Tableau Prep Builder agrupa ações similares de um campo. Você gosta disso, porque facilita a encontrar as alterações feitas no conjunto de dados posteriormente.

      A única alteração que precisou fazer aqui foi corrigir os valores do campo Estado.

    5. Nomeie sua etapa de limpeza para monitorar seu trabalho. Por exemplo Renomear estados.

    Você executou muitas ações de limpeza nos arquivos e não acredita em como foi fácil e rápido. Talvez você chegue em casa para o jantar! Para garantir que não perca todo o seu trabalho, salve o fluxo.

    Clique em Arquivo > Salvar ou Arquivo > Salvar como. Salve o arquivo como um arquivo de fluxo (.tfl) e dê um nome. Por exemplo, Meu Superstore.

    Dica: ao salvar seus arquivos de fluxo, é possível salvá-los como um arquivo de fluxo (.tfl) ou como um arquivo empacotado (.tflx), além de empacotar seus arquivos de dados locais com eles para compartilhar o fluxo e os arquivos com terceiros. Para obter mais informações sobre como salvar e compartilhar os fluxos, consulte Salvar e compartilhar seu trabalho(Link opens in a new window).

    4. Agrupar seus dados

    Agora que todos os arquivos foram limpos, você está pronto pra agrupar todos eles.

    Como todos os arquivos têm campos semelhantes após seus esforços de limpeza, para juntar todas as linhas em uma única tabela, será necessário unir as tabelas.

    Você se recorda de que há uma opção de etapa chamada União de linhas, mas se pergunta se pode arrastar e soltar as etapas para uní-las. Você decide tentar.

    Unir linhas de dados

    1. No painel Fluxo, arraste a segunda etapa de limpeza para a última no topo da última etapa no fluxo e solte-a na opção União de linhas. Por exemplo, arraste a etapa de limpeza Renomear estados até a etapa de limpeza Tipo de dados alterado e solte-a na opção União de linhas.

      Você vê que o Tableau Prep Builder adicionou uma nova etapa de União de linhas ao fluxo. Ótimo! Agora você também deseja adicionar os outros campos a essa união de linhas.

    2. Arraste a segunda etapa de limpeza no fluxo para a nova etapa Corrigir datas/nomes de campo até a nova etapa União de linhas e solte-a em Adicionar para adicioná-la à união de linhas existente.

    3. Arraste a etapa orders_south_2015 até a nova etapa União de linhas. Solte-a em Adicionar para adicioná-la a união de linhas existente.

      Agora todos os arquivos estão agrupados em uma tabela única. No painel Fluxo , selecione a nova etapa de União para ver os resultados.

      Você observa que o Tableau Prep Builder correspondeu automaticamente os campos com os mesmos nomes e tipos.

      Além disso, percebe que as cores atribuídas às etapas no fluxo são usadas nos perfis de união de linhas para indicar a origem do campo e também aparecem na faixa colorida na parte superior de cada campo para mostrar se ele existe na tabela.

      Você observa que um novo campo chamado Nomes de tabela foi adicionado, que lista as tabelas de origem de todas as linhas da união.

      Uma lista de campos sem correspondência também é mostrada no painel de resumo e é possível ver imediatamente que os campos Produto e Descontos só aparecem no arquivo Orders_Central.

    4. Para analisar esses campos de maneira mais detalhada, no painel Resultados da união de linhas, marque a caixa de seleção Mostrar apenas os campos sem correspondência.

      Ao examinar os dados do campo, você vê rapidamente que os dados são os mesmos, mas o nome do campo é diferente. Você poderia apenas renomear o campo, mas se pergunta se poderia simplesmente arrastar e soltar esses campos para mesclá-los. Você decide tentar.

    5. Selecione o campo Produto e arraste e solte-o no campo Nome do produto para mesclá-los. Depois de mesclados, eles não aparecem mais no painel.

    6. Repita essa etapa para mesclar o campo Descontos ao campo Desconto.

      O único campo que não tem uma correspondência agora é o Caminhos do arquivo. Esse campo mostra os caminhos do arquivo da união de linhas curinga criada para os pedidos de vendas do sul. Você decide deixar esse campo intacto, pois possui boas informações.

      Dica: você tem várias opções para corrigir campos sem correspondência após uma união de linhas.

      Dependendo da versão do Tableau Prep Builder que esteja em uso, é possível selecionar um campo na lista Campos sem correspondência (versão 2018.2.1 e posteriores) e se o Tableau Prep Builder detectar uma correspondência possível, ele a destacará na cor amarela. Para mesclar os campos, focalize o campo destacado e clique no botão com o símbolo de mais que aparece.

      Para conhecer mais maneiras de mesclar campos em uma união de linhas, consulte Corrigir campos sem correspondência.

    7. Desmarque a caixa de seleção Mostrar apenas campos sem correspondência para mostrar todos os campos incluídos na união de linhas.

    8. Nomeie a etapa de união de linhas para representar o que está incluído nessa união. Por exemplo, Todos os pedidos.

    Verifique seu trabalho: veja “Unir linhas de dados” em ação

    Clique na imagem para reproduzi-la

    Você é um gênio de limpeza! Enquanto admira os resultados, seu chefe telefona. Ele esqueceu de mencionar que também quer que você inclua as devoluções de produtos na análise. E espera que não seja um problema. Com o Tableau Prep Builder no kit de ferramentas, isso não é nenhum problema.

    Limpar os dados de devoluções de produtos

    Você dá uma olhada no arquivo Excel enviado por seu chefe com as devoluções de produtos e ele parece estar um pouco bagunçado. Você adiciona o arquivo novo return_reasons new ao fluxo para analisá-lo de maneira mais detalhada.

    1. No painel Conexões, clique em Adicionar conexão. Selecione Microsoft Excel e navegue até os arquivos de dados de amostra Superstore (consulte Arquivos de amostra para baixar o arquivo).

    2. Selecione return reasons_new.xlsx e depois clique em Abrir para adicionar o arquivo ao painel Fluxo.

      Há apenas 4 campos desse arquivo que você deseja incluir no fluxo: ID de pedido, ID de produto, Motivo da devolução e Observações.

    3. No painel Entrada do returns_new, desmarque a caixa de seleção na parte superior da grade do campo para desmarcar todas as caixas de seleção. Em seguida, selecione a caixa de seleção dos campos ID de pedido, ID de produto, Motivo da devolução e Observações.

    4. Renomeie a etapa de entrada para que reflita melhor os dados incluídos nessa entrada. No painel Fluxo, clique duas vezes no nome da etapa de entrada Returns_new e digite Devoluções (tudo).

      Ao olhar os valores de campo de amostra, você observa que o campo Observações parece ter muitos dados diferentes agrupados.

      Há limpeza a ser feita nesse arquivo antes que possa prosseguir para qualquer trabalho com os dados, então você adiciona uma etapa de limpeza para ver o que acontece.

    5. No painel Fluxo, selecione a etapa de Entrada Devoluções (tudo), clique no ícone de adição e adicione uma etapa de limpeza.

      No painel Perfil, redimensione o campo Observações para que possa ver melhor as entradas. Para isso, clique a arraste a borda direita externa do campo para a direita.

    6. No campo Observações, use a barra de rolagem visual à direita dos valores do campo para examiná-los.

      Você observa alguns problemas:

      • Algumas entradas apresentam um espaço adicional. Isso pode fazer com que o campo seja lido como um valor nulo.

      • Parece que o nome do aprovador está incluído na entrada de observações de devolução. Para trabalhar melhor com esses dados, você precisará dessas informações em um campo separado.

      Para lidar com os espaços extras, você se lembra de que havia uma opção de limpeza para remover espaços à direita e decide tentar usá-la para ver se ela consegue corrigir esse problema.

    7. Selecione o campo Observações. Clique no menu Mais opções (seta suspensa em versões anteriores) e selecione Limpar > Remover espaços.

      Sim! Você fez exatamente o que queria. Os espaços adicionais foram removidos.

      Depois você deseja criar um campo separado para o nome do aprovador. Você vê uma opção Dividir valores no menu e decide usá-la.

    8. Selecione o campo Observações. Clique no menu Mais opções (seta suspensa em versões anteriores) e selecione Dividir valores > Divisão automática.

      Essa opção fez exatamente o que esperava que fizesse. Ela dividiu automaticamente as observações de devolução e o nome do aprovador em campos separados.

      Assim como no Tableau Desktop, o Tableau Prep Builder atribui automaticamente um nome a esses campos. Então você precisará renomeá-los com um nome significativo.

    9. Selecione o campo Divisão de observações 1. Clique duas vezes no nome de campo e digite Observações de devolução.

    10. Repita essa etapa no segundo campo e renomeie-o como Aprovador.

    11. Como não precisa mais dele, remova o campo Observações original. Selecione o campo Observações, clique no menu Mais opções (seta suspensa nas versões anteriores) e selecione Remover (Remover campo nas versões anteriores) no menu.

      Ao olhar para o novo campo Aprovador, você observa que os valores do campo listam os mesmos nomes, mas que eles foram inseridos de maneira diferente. Você deseja agrupá-los para eliminar as muitas variações do mesmo valor.

      Será que a opção Agrupar valores (Agrupar e substituir em versões anteriores) pode ajudar com isso?

      Você se lembra que tinha uma opção de Caracteres usuais. Como esses valores compartilham das mesmas letras, você decide tentar.

    12. Selecione o campo Aprovador. Clique no menu Mais opções (seta suspensa em versões anteriores) e selecione Agrupar valores (Agrupar e substituir em versões anteriores > Caracteres usuais.

      Essa opção agrupou todas as variações de cada nome para você. Isso era exatamente o que você queria fazer.

      Após verificar os outros nomes para garantir que foram agrupados corretamente, você clica em Concluído para fechar o editor Agrupar valores.

      Esse arquivo está com uma boa aparência.

    13. Nomeie sua etapa de limpeza para monitorar seu trabalho. Por exemplo, Observações limpas.

    Agora que os dados de devoluções de produtos foram todos limpos, você deseja adicioná-los aos dados de pedidos dos arquivos unidos. Mas muitos desses campos não existem nos arquivos unidos. Para adicionar esses campos (colunas de dados) ao conjunto de dados unido, você precisa usar uma união de colunas.

    Unir colunas de dados

    Para unir seus dados, os arquivos devem ter ao menos um campo em comum. Neste caso, os arquivos compartilham os campos ID de pedido e ID de produto, então é possível uní-los para ver todas as linhas que têm esses campos em comum. Você lembra de ter visto a opção para criar uma união de colunas quando criou sua união de linhas ao arrastar e soltar as tabelas, então decide tentar.

    1. No painel Fluxo, arraste a etapa Observações limpas até a etapa de união de linhas Todos os pedidos e solte-a em União de colunas.

      Ao unir os arquivos, o Tableau Prep Builder mostra os resultados no perfil União de colunas.

      Trabalhar com uniões de coluna pode ser complicado. Normalmente, você deseja ter uma visão clara dos fatores incluídos na união, como os campos usados para unir os arquivos, o número de linhas incluídas nos resultados e qualquer campo que não esteja incluído ou que sejam valores nulos.

      Conforme revisa os resultados da união de colunas no Tableau Prep Builder, você fica satisfeito em ter tantas informações e interatividade na ponta dos seus dedos.

      Dica: o painel mais à esquerda do perfil da união de colunas é onde você pode explorar e interagir com a união. Também é possível editar valores diretamente nos painéis Cláusulas de união de colunas e realizar operações de limpeza no painel Resultados da união de colunas.

      Clique no diagrama Tipo de união de coluna para testar configurações de união diferentes e ver o número de linhas incluídas ou excluídas em sua união para cada tabela da seção Resumo dos resultados de união de colunas.

      Selecione os campos que deseja unir na seção Cláusulas de união de colunas aplicadas ou adicione cláusulas de união de colunas sugeridas da seção Recomendações da cláusula de união de colunas.

      Para obter mais informações sobre como trabalhar com uniões, consulte Agregar, unir colunas ou linhas de dados(Link opens in a new window).

      Você observa que tem mais de 13.000 linhas excluídas de seus arquivos Todos os pedidos. Ao criar automaticamente a união de colunas, o Tableau Prep Builder uniu automaticamente o campo ID de produto, mas você também queria unir o campo ID de pedido.

      Ao examinar o painel à esquerda do perfil de união, você observa que ID de pedido está na lista de cláusulas de união de colunas recomendadas, então o adiciona rapidamente.

    2. No painel à esquerda do perfil União de colunas, na seção Recomendações da cláusula de união de colunas, selecione Order ID = Order ID e clique no botão com o símbolo de mais para adicionar a cláusula de união de colunas.

      Como o Tipo de união de colunas está definido para uma união interna (a configuração padrão do Tableau Prep Builder), a união incluirá apenas os valores que existem em ambos os arquivos. Mas você quer todos os dados dos arquivos Pedidos, assim como os dados de devolução deles. Então será necessário alterar o tipo de união de colunas.

    3. Na seção Tipo de união de colunas, clique no lado do diagrama para incluir todos os pedidos. No exemplo abaixo, clique no lado esquerdo do diagrama para alterar a união de colunas para uma união de colunas à esquerda e inclua todos os dados da etapa de união de linhas Todos os pedidos e os dados correspondentes da etapa de Observações limpas.

      Agora você tem todos os dados dos arquivos de pedido de vendas e todos os dados de devolução que se aplicam a eles. Você revisa o painel Cláusulas de união de colunas e vê os valores distintos que não existem no outro arquivo.

      Por exemplo, há muitas linhas de pedido (mostrado em vermelho) que não possuem dados de devolução correspondentes. Você adora ser capaz de explorar esse nível de detalhe de sua união de colunas.

      Está ansioso para começar a analisar esses dados no Tableau Desktop, mas observa alguns resultados da união que deseja limpar antes disso. Ainda bem que sabe o que fazer!

      Dica: está se perguntando se os dados estão suficientemente limpos? É possível visualizar seus dados no Tableau Desktop em qualquer etapa do fluxo para verificar.

      Apenas clique com o botão direito do mouse no painel Fluxo e selecione Visualizar. no Tableau Desktop no menu.

      Você pode testar com seus dados e qualquer alteração feita no Tableau Desktop não será gravada na fonte de dados do Tableau Prep Builder. Para obter mais informações consulte Exibir a amostra de dados no Tableau(Link opens in a new window).

    4. Antes de começar a limpeza nos resultados da união de colunas, nomeie a etapa União de colunas como Pedidos+Devoluções e salve o fluxo.

    Limpar os resultados da união de colunas

    Observação: para limpar os campos da sua união de colunas, é possível realizar operações de limpeza diretamente na etapa da união. Para o propósito deste tutorial, adicionaremos uma etapa de limpeza para que você possa ver claramente suas operações de limpeza. Se quiser tentar realizar essas etapas diretamente na etapa de união de colunas, ignore as etapas 1 e 3 abaixo.

    Ao unir as duas etapas, os campos comuns ID de pedido e ID de produto foram adicionados nas duas tabelas.

    Você deseja manter o campo ID de produto de todos os pedidos e o campo ID de pedido do arquivo de devoluções e remover os campos duplicados que vieram desses arquivos. Você também não precisa dos campos Caminhos do arquivo e Nomes de tabela no arquivo de saída, então também deseja removê-los.

    Dica: ao unir tabelas usando campos que existem nos dois arquivos, o Tableau Prep Builder trará os dois arquivos e renomeará o campo duplicado do arquivo secundário adicionando um "-1" ou um "-2" ao nome do campo. Por exemplo ID do pedido e ID do pedido -1.

    1. No painel Fluxo, selecione Pedidos+Devoluções, clique no ícone de adição e adicione uma etapa de limpeza.

    2. No painel Perfil, selecione e remova os campos a seguir:

      • Nomes de tabela

      • ID do pedido

      • Caminhos do arquivo

      • ID-1 do produto

    3. Renomeie o campo ID de pedido-1 para ID de pedido.

      Há alguns valores nulos onde o produto foi devolvido, mas não há observações de devolução ou aprovador indicados. Para facilitar a análise desses dados, você deseja adicionar um campo com um valor Sim e Não para indicar se o produto foi devolvido.

      Você não tem esse campo, então é possível adicioná-lo ao criar um campo calculado.

    4. Na barra de ferramentas, clique em Criar campo calculado.

    5. Nomeie o campo Devolvido?, em seguida insira o cálculo a seguir e clique em Salvar.

      If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END

      Para sua análise, você também gostaria de saber o número de dias que leva para enviar um pedido, mas também não tem esse campo.

      Contudo, você possui todas as informações de que precisa para criá-lo, então adiciona outro campo calculado para isso.

    6. Na barra de ferramentas, clique em Criar campo calculado.

    7. Nomeie o campo Dias para envio, em seguida insira o cálculo a seguir e clique em Salvar.

      DATEDIFF('day',[Order Date],[Ship Date])

    8. Nomeie sua etapa Limpar pedidos +Devoluções.

    9. Salve seu fluxo.

    5. Executar o fluxo e gerar saída

    Seus dados estão com uma boa aparência e você está pronto para gerar o arquivo de saída para começar a analisar no Tableau Desktop. Tudo que precisa fazer é executar o fluxo e gerar o arquivo de extração. Para isso, é necessário adicionar uma etapa de Saída.

    1. No painel Fluxo, selecione Limpar Pedidos+Devoluções, clique no ícone de adição e selecione Saída (Adicionar saída em versões anteriores).

      Ao adicionar uma etapa de saída, o painel de Saída é aberto e mostra um instantâneo de seus dados. Aqui é possível selecionar o tipo de saída que deseja gerar e especificar o nome e local onde deseja salvar o arquivo.

      O local padrão é o repositório Meu Tableau Prep Builder na pasta das fontes de dados.

    2. No painel à esquerda, na lista suspensa Salvar saída no, selecione Arquivo (selecione Salvar no arquivoem versões anteriores).

    3. Clique no botão Procurar, em seguida, na caixa de diálogo Salvar extração como, insira um nome para o arquivo, Orders_Returns_Superstore por exemplo, e clique em Aceitar.

    4. No campo Tipo de saída, selecione um dos tipos de saída a seguir. Dependendo da versão do Tableau Desktop em uso, é possível escolher das opções a seguir:

      • Extração de dados do Tableau (.hyper) do Tableau Desktop versão 10.5 e posteriores.

      • Extração de dados do Tableau (.tde) do Tableau Desktop versão 10.0 até 10.4.

      • Valores separados por vírgula (.csv) se quiser compartilhar a extração com terceiros.

      Dica: você tem escolhas ao gerar uma saída do fluxo. Você pode gerar um arquivo de extração ou publicar os dados como uma fonte de dados no Tableau Server ou no Tableau Online. para obter mais informações sobre como gerar arquivos de saída, consulte Criar e publicar extrações de dados e fontes de dados(Link opens in a new window).

    5. Na seção Opções de gravação, visualize as opções para gravar os novos dados em seus arquivos. Você deseja usar o padrão(Criar tabela) e substituir a tabela com a saída de fluxo, portanto não há nada para mudar aqui.

      Dica: a partir da versão 2020.2.1, você pode escolher como deseja gravar os dados de fluxo de volta à tabela. Escolha entre duas opções; Criar tabela ou Anexar tabela. Por padrão, o Tableau Prep Builder usa a opção Criar tabela e substitui os dados de tabela por os novos dados ao executar o fluxo. Se você escolher Anexar tabela, o Tableau Prep Builder adiciona os dados de fluxo à tabela existente para que você possa rastrear dados novos e históricos em cada fluxo executado. Para obter mais informações, consulte Configurar opções de gravação

    6. No painel Saída, clique em Executar fluxo ou clique no botão Executar fluxo no painel Fluxo para gerar a saída.
    7. Quando a execução do fluxo tiver terminado, uma caixa de diálogo de status mostra se o fluxo executou com sucesso e o tempo que ele levou para executar. Clique em Concluído para fechar a caixa de diálogo.

      Para manter os dados atualizados, você pode executar o fluxo manualmente no Tableau Prep Builder ou usar a linha de comando. Se tiver o Data Management Add-on e o Tableau Prep Conductor ativado, também poderá publicar o fluxo para Tableau Server ou Tableau Online e executar o fluxo em uma agenda.

      A partir da versão 2020.2.1, você também pode optar por atualizar todos os dados sempre que o fluxo for executado, ou executar o fluxo usando a atualização incremental e processar apenas os novos dados cada vez.

      Para obter mais informações sobre como mantes os dados atualizados, consulte os tópicos a seguir:

    Conclusão e recursos

    Você é um astro da preparação de dados! Pegou dados sujos e os transformou com facilidade! Rapidamente você limpou e preparou os dados de vários conjuntos de dados e os transformou em um conjunto de dados simples e claro que agora pode usar no Tableau Desktop para análise.

    Quer praticar mais? Tente replicar o resto do fluxo de amostra do Superstore usando os arquivos de dados encontrados aqui:

    Você também pode encontrar os arquivos no seguinte local do seu computador após instalar o Tableau Prep Builder:

    • (Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files
    • (Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files

    Quer treinar mais? Veja os vídeos de treinamento(Link opens in a new window) do Tableau Prep Builder, confira esses excelentes recursos(Link opens in a new window) ou faça um curso de treinamento presencial(Link opens in a new window).

    Deseja mais informações sobre os tópicos abordados? Veja os outros tópicos na Ajuda online do Tableau Prep Builder.

    Outros artigos nesta seção

    Agradecemos seu feedback! Ocorreu um erro ao enviar o feedback. Tente novamente ou envie-nos uma mensagem.