Limpar e formatar dados

O Tableau Prep Builder fornece várias operações de limpeza que podem ser usadas imediatamente para limpar e formatar os dados. A limpeza de dados sujos facilita a combinação e análise de dados ou a compreensão de outras pessoas em relação aos dados durante o compartilhamento dos conjuntos de dados.

Você também pode limpar os dados usando uma etapa dinâmica ou uma etapa de script para aplicar scripts R ou Python ao fluxo. Para obter mais informações, consulte Dinamizar os dados ou Usar scripts R e Python no fluxo.

Sobre as operações de limpeza

Você limpa seus dados ao aplicar operações de limpeza como filtragem, adição, renomeação, divisão, agrupamento ou remoção de campos. Em versões anteriores, as operações de limpeza só podiam ser executadas no tipo Etapa de limpeza. No Tableau Prep Builder versão 2018.2.1 e posteriores, também é possível executar operações de limpeza na grade de dados em uma etapa de limpeza.

No Tableau Prep Builder versão 2018.3.1 e posteriores, é possível executar operações de limpeza na maioria das etapas do fluxo. Você pode aplicar operações de limpeza limitadas na etapa de entrada e não pode aplicar operações de limpeza na etapa de saída. Para obter mais informações sobre como aplicar operações de limpeza na etapa de entrada, consulte Aplicar operações de limpeza na etapa de entrada.

Operações de limpeza disponíveis

A tabela a seguir mostra quais operações de limpeza estão disponíveis em cada tipo de etapa:

  Entrada Limpeza Agregação Tabela dinâmica União de colunas União de linhas Saída
Filtrar X X X X X X  
Agrupar e substituir   X   X X X  
Limpar   X   X X X  
Dividir valores   X   X X X  
Renomear campo X X X X X X  
Duplicar Campo   X   X X X  
Manter apenas o campo X X X X X X  
Remover campo X X X X X X  
Criar campo calculado   X   X X X  
Editar valor   X   X X X  
Alterar tipo de dados X X X X X X  

Conforme faz alterações nos dados, anotações são adicionadas à etapa correspondente no painel Fluxo e uma entrada é adicionada ao painel Alterações para monitorar suas ações. Se fizer alterações na etapa de entrada, a anotação será mostrada à esquerda da etapa, no painel Fluxo, e ainda será mostrada no Perfil de entrada, na lista de campos.

A ordem em que você aplica mudanças é significativa. As alterações feitas a Agregar, Tabelas dinâmicas, União de colunas e União de linhas são executadas antes ou depois dessas ações de reformulação, dependendo de onde está o campo ao fazer a alteração. O local onde a alteração foi feita é mostrado no painel Alterações da etapa.

O exemplo a seguir mostra uma alteração de campo de uma única tabela em uma etapa de união de colunas. A alteração é realizada antes da ação de união para fornecer os resultados corrigidos.

Ordem das operações

A tabela a seguir mostra onde a ação de limpeza é executada nos tipos de etapa Agregar, Dinamizar, União de colunas e União de linhas, dependendo de onde o campo está na etapa.

Ação Tipo de etapa: Agregação Agregação Tabela dinâmica Tabela dinâmica União de colunas União de colunas União de linhas União de linhas
  Localização do campo: Campos agrupados Campos agregados Não está na tabela de dinâmica Criado a partir da tabela dinâmica Incluído em uma tabela* Incluído nas duas tabelas* Campos incompatíveis Campos combinados
Filtrar   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Agrupar e substituir   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Limpar   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Dividir valores   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Renomear campo   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Duplicar Campo   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Manter apenas o campo   Após a agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Remover campo   Remove da agregação Remove da agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Criar campo calculado   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Editar valor   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Alterar tipo de dados   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Antes da união de colunas Antes da união de linhas Após a união de linhas

Observação: para união de colunas, se o campo for um campo calculado criado usando um campo de uma tabela, a alteração será aplicada antes da união de colunas. Se o campo for criados com campos de ambas as tabelas, a alteração será aplicada depois da união.

Aplicar operações de limpeza

Para aplicar operações de limpeza a campos, use as opções da barra de ferramentas ou clique em Mais opções no cartão Perfil do campo, na grade de dados ou no painel Resultados para abrir o menu.

Nos tipos de etapas Agregar, Dinamizar, Unir colunas e Unir linhas, o menu Mais opções está disponível nos cartões de perfil do painel Resultados. Além disso, é possível aplicar operações de limpeza na grade de dados na etapa de limpeza. Basta clicar no botão Ocultar painel Perfil para recolher o painel Perfil e, em seguida, clicar em Mais opções em um campo para abrir o menu.

Se você realizar as mesmas operações ou ações de limpeza repetidamente em todo o fluxo, poderá copiar e colar etapas, ações ou até mesmo campos. Para obter mais informações, consulte Copiar etapas, ações e campos.

Observação: nem todas as operações de limpeza estão disponíveis na grade de dados. Por exemplo, caso deseje editar um valor em linha, você deve fazer isso no painel Perfil.

Barra de ferramentas do painel Perfil Menu suspenso

Para aplicar operações de limpeza a um campo, faça o seguinte:

  1. No painel Perfil ou Resultados, ou na grade de dados, selecione o campo que deseja alterar.

  2. Na barra de ferramentas ou no menu Mais opções do campo, selecione uma das opções a seguir:

    • Filtrar ou Filtrar valores: selecione uma das opções de filtro, clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) em um valor de campo para manter ou excluir valores. Você também pode usar o filtro Valores selecionados para selecionar e escolher os valores a serem filtrados, incluindo os valores que não estão no seu exemplo de fluxo. Para obter mais informações sobre as opções de filtro, consulte Filtrar dados.

    • Agrupar e substituir: selecione manualmente os valores ou use o agrupamento automático. Além disso, é possível selecionar vários valores no cartão Perfil e clicar com o botão direito do mouse ou manter a tecla Ctrl pressionada (MacOS) e clicar para agrupar ou desagrupar valores ou editar o valor do grupo. Para obter mais informações sobre como utilizar Agrupar e substituir, consulte Mapear automaticamente os valores para um valor padrão usando uma correspondência parcial.

    • Limpar: selecione de uma lista de operações rápidas de limpeza para aplicar a todos os valores no campo.

    • Dividir valores: dividir valores automaticamente com base em um separador comum ou usar divisão personalizada para especificar como deseja dividir valores de campo.

      Divisões automáticas e personalizadas funcionam da mesma maneira no Tableau Desktop. Para obter mais informações, consulte Dividir um campo em vários campos na Ajuda para criação na Web e do Tableau Desktop.

    • Renomear campo

    • Campo Duplicado (versão 2019.2.3 e posterior) Crie uma cópia do campo e dos valores.

    • Manter apenas o campo(versão 2019.2.2 e posterior)

    • Criar campo calculado

    • Remover (Remover campo nas versões anteriores)

      Observação: a partir da versão 2019.3.1, você pode usar a opção Publicar como função de dados para criar funções de dados personalizadas que podem ser aplicadas aos campos, para validar os valores de campo na limpeza dos dados. Para obter mais informações sobre essa opção, consulte Criar funções de dados personalizadas (versão 2019.3.1 e posterior).

  3. Para editar um valor, clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) em um ou mais valores, selecione Editar valor e insira um novo valor. Além disso, é possível selecionar Substituir com nulo para substituir os valores com um valor nulo ou clicar duas vezes em um único valor para editá-lo diretamente. Para obter mais informações sobre como editar valores de campo, consulte Editar valores de campo.

  4. Consulte os resultados dessas operações no painel Perfil, painéis Resumo ou na grade de dados.

Visualizar suas alterações

Os diferentes tipos de operações de limpeza são representados por ícones nas etapas do fluxo. Caso mais de quatro tipos de operações sejam aplicados a uma etapa, uma elipse será exibida na etapa. Passe o cursor sobre esses ícones para exibir as anotações que mostram as operações aplicadas e a ordem na qual são executadas.

A partir do Tableau Prep Builder versão 2019.1.3 e posteriores, você pode clicar em uma anotação no ícone de alteração em uma etapa no painel Fluxo ou em um cartão de perfil no painel Perfil ou Resultados, e a alteração e o campo afetados serão realçados no painel Alterações e no painel Perfil ou Resultados.

Além disso, é possível selecionar uma etapa e expandir o painel Alterações para exibir os detalhes de cada alteração, editar ou removê-las, ou arrastá-las para cima e para baixo para trocar a ordem em que serão aplicadas. No Tableau Prep Builder versão 2019.1.1, você pode adicionar uma descrição para fornecer contexto para outros usuários. Para obter mais informações sobre como adicionar descrições às alterações, consulte Adicionar descrições a etapas de fluxo e ações de limpeza

Anotação de limpeza Painel Alterações

Ao visualizar alterações em uma etapa Agregar, Dinamizar, União de colunas ou União de linhas, a ordem em que a alteração é aplicada é mostrada antes ou depois da ação de reformulação. A ordem dessas alterações é aplicada pelo sistema e não pode ser alterada. É possível editar e remover a alteração.

Copiar etapas, ações e campos

Ao limpar seus dados, geralmente você executa as mesmas operações ou ações de limpeza diversas vezes em seu fluxo. Para tornar a limpeza e a formatação de dados mais eficientes, é possível copiar e colar essas operações ou ações em todo o fluxo, para que você possa executar uma operação ou ação de limpeza uma vez e, posteriormente, usar mais uma vez onde for necessário. Você pode até mesmo duplicar campos para experimentar com diferentes operações de limpeza.

Copiar e colar etapas

Copie uma ou mais etapas para usá-las em outra área do fluxo. Esta opção não está disponível para etapas de entrada que incluem uma união curinga.

  1. No painel Fluxo, selecione uma ou mais etapas no fluxo.

  2. Clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) na etapa e selecione Copiar.

  3. Clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) em qualquer espaço em branco na tela e clique em Colar.

  4. Arraste e solte as etapas onde desejar que fiquem no fluxo. Dependendo das etapas copiadas e onde você deseja adicioná-las, talvez seja necessário remover as linhas de fluxo ou mover as etapas. Por exemplo, para conectar uma etapa às etapas copiadas, remova a linha de fluxo existente, se houver, arraste a etapa existente para a nova etapa e solte em Adicionar.

    Para obter mais informações sobre como organizar o fluxo, consulte Reorganizar o layout do seu fluxo (versão 2019.2.2 e posterior).

Copiar e colar operações de limpeza

Você pode copiar e colar operações de limpeza das seguintes maneiras para reutilizar as ações:

  • Copie uma operação do painel Alterações em uma etapa e cole-a no painel Alterações da mesma etapa ou de outra para aplicar a mesma operação nela.
  • Arraste e solte uma operação do painel Alterações e solte em outros campos no painel Perfil dessa etapa para aplicar essa operação a vários campos. Essa opção não está disponível para operações que afetam vários campos, como campos calculados.
  1. No painel Alterações, selecione a alteração que deseja copiar.
  2. Clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) no item de alteração, em seguida, selecione Copiar no menu.

  3. No painel Alterações, em que deseja colar a alteração, clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) e selecione Colar. Selecione a alteração e clique em Editar para fazer ajustes conforme necessário.

Para arrastar e soltar uma alteração em outros campos da etapa, faça o seguinte:

  1. No painel Alterações, selecione a alteração que deseja copiar.
  2. Arraste a alteração no campo em que deseja aplicá-la e solte-a. Repita essa ação conforme necessário.

Copiar campos (versão 2019.2.3 e posterior)

Se você quiser experimentar as operações de limpeza em um campo, mas não quiser alterar os dados originais, poderá copiar os campos.

  1. No painel Perfil, na grade de dados ou no painel Resultados, selecione o campo que deseja copiar.

  2. No menu Mais opções, selecione Campo duplicado.

Um novo campo é criado com o mesmo nome e um modificador. Por exemplo, "Data de envio -1".

Mesclar campos

Se você tiver campos que contêm os mesmos valores nomeados de forma diferente, é possível mesclá-los em um campo para agrupá-los, arrastando um campo até o outro. Ao mesclar os campos, o campo de destino se torna o campo primário e o nome do campo de destino permanece o mesmo. O campo mesclado ao campo de destino é removido.

Exemplo:

Uma união de linhas curinga resulta em 3 campos com os mesmos valores Mesclar 3 filtros em 1

Ao mesclar os campos, o Tableau Prep Builder mantém todos os campos do campo de destino e substitui todos os nulos dele por valores de campos de origem mesclados com o campo de destino. Os campos de origem são removidos.

Exemplo

Nome Contact_Phone Business_Phone Cell_Phone Home_Phone
Bob 123-4567 123-4567 nulo nulo
Sally nulo nulo 456-7890 789-0123
Fred nulo nulo nulo 567-8901
Emma nulo 234-5678 345-6789 nulo

Se você mesclar os campos Business _Phone, Cell_Phone e Home_Phone com o campo Contact_phone, os outros campos serão removidos e resultarão no seguinte:

Nome Contact_Phone
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

Para mesclar campos, execute uma das ações a seguir:

  • Arraste e solte um campo no outro. Um indicador Soltar para mesclar campos é exibido.

  • Selecione vários arquivos e clique com o botão direito do mouse na seleção para abrir o menu de contexto, em seguida clique em Mesclar campos.

  • Selecione vários campos e clique em Mesclar campos na barra de ferramentas.

Para obter informações sobre como corrigir campos sem correspondência devido a uma união de linhas, consulte Corrigir campos sem correspondência.

Aplicar operações de limpeza usando recomendações (versão 2018.3.2 e posterior)

Às vezes, pode ser difícil identificar qual operação de limpeza será necessária para corrigir problemas nos dados. O Tableau Prep Builder pode analisar os dados e recomendar operações de limpeza que podem ser aplicadas automaticamente para corrigir com rapidez os problemas nos campos de dados ou ajudar a identificar problemas para corrigi-los. Esse recurso está disponível em todos os tipos de etapas, exceto em Entrada, Saída e Unir colunas.

Observação: se não quiser usar esse recurso, é possível desativá-lo. No menu superior, acesse Ajuda > Configurações e desempenho. Em seguida, clique em Habilitar recomendações para desmarcar a caixa de seleção ao lado da configuração.

Os tipos de recomendação incluem:

  • Funções de dados

  • Agrupar e substituir (também se aplica a campos com funções de dados começando na versão 2019.2.3)
  • Filtrar

  • Substituir valores por valores nulos

  • Remover campos

  • Split (versão 2019.1.1 e posterior)

    Observação: essa opção funciona especificamente com dados em arquivos de texto de largura fixa. Para usar a recomendação de divisão com esse tipo de arquivo, após conectar-se à fonte de dados, na etapa de entrada, na guia Configurações de texto, selecione um caractere de Separador de campo que não esteja sendo usado nos dados, para que eles sejam carregados como um campo único.

  • Cortar espaços

Aplicar recomendações

  1. Execute um destes procedimentos:

    • Clique no ícone de lâmpada no canto superior direito do cartão Perfil.
    • Na barra de ferramentas, clique na seta suspensa Recomendações para exibir todas as recomendações referentes a seu conjunto de dados e selecione uma recomendação na lista.

    Essa opção é exibida somente quando as alterações recomendadas são identificadas pelo Tableau Prep Builder.

  2. Para aplicar a recomendação, passe o mouse sobre o cartão Recomendações e clique em Aplicar.

    A alteração é aplicada automaticamente e uma entrada é adicionada ao painel Alterações. Para remover uma Alteração, clique em Desfazer no menu superior ou passe o mouse sobre a alteração no painel Alterações e clique no X para removê-la.

  3. Se o Tableau Prep Builder identificar recomendações adicionais como resultado da alteração, o ícone de lâmpada permanecerá no cartão Perfil até que nenhuma recomendação adicional seja encontrada.

    Repita as etapas acima para aplicar quaisquer alterações adicionais ou ignorar a alteração sugerida e usar as outras ferramentas de limpeza no Tableau Prep Builder para solucionar os problemas de dados.

Editar valores de campo

Diversas variações do mesmo valor podem impedir um resumo preciso dos dados. É possível corrigir essas variações de forma rápida e fácil usando as opções a seguir no Tableau Prep Builder.

Observação: qualquer edição feita no valores devem ser compatíveis com o tipo de dados do campo.

Editar valor único

  1. No cartão Perfil, clique no valor que deseja editar e insira o novo valor. Um ícone de agrupamento aparece próximo ao valor.

    Como alternativa, clique com o botão direito do mouse e, em seguida, clique em Editar valor. A alteração é gravada no painel Alterações, no lado esquerdo da tela.

  2. Consulte os resultados no painel Perfil e na grade de dados.

Editar vários valores

Há várias opções para a edição de vários valores de uma só vez. Por exemplo, use operações rápidas de limpeza para remover a pontuação em todos os valores de um campo, agrupe valores manualmente ao usar a seleção múltipla, agrupe valores automaticamente ao usar algoritmos de correspondência nebulosa que encontram valores similares ou selecione vários valores e os substitua por Nulo.

Observação: ao mapear vários valores em um só, o campo original mostra um ícone de agrupamento próximo ao valor, que mostra quais valores estão agrupados.

Editar vários valores usando operações rápidas de limpeza

Esta opção se aplica apenas a campos de texto.

  1. No painel Perfil ou Resultados, ou na grade de dados, selecione o campo que deseja editar.

  2. Clique em Mais opções, selecione Limpar, em seguida selecione uma das opções a seguir:

    • Tornar letras maiúsculas: altera todos os valores de texto em letras maiúsculas.

    • Tornar letras minúsculas: altera todos os valores de texto em letras minúsculas.

    • Remover letras: remove todas as letras e deixe apenas outros caracteres.

    • Remover números: remove todos os números e deixa apenas letras e outros caracteres.

    • Remover pontuação: remove toda a pontuação.

    • Cortar espaços: remove espaços à esquerda e à direita.

    É possível empilhar operações para aplicar várias operações de limpeza nos campos. Por exemplo, primeiro selecione Limpar > Remover números, em seguida selecione Limpar > Remover pontuação para remover todos os números e pontuação dos valores de campo.

  3. Para desfazer as alterações, clique na seta Desfazer, na parte superior do painel Fluxo, ou remova a alteração da lista de alterações.

Agrupar e editar vários valores embutidos

  1. No cartão Perfil, selecione o campo que deseja editar.

  2. Pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (MacOS), e selecione os valores que deseja agrupar.

  3. Clique com o botão direito do mouse e selecione Agrupar no menu de contexto. O valor da seleção clicada com o botão direito do mouse se torna o nome padrão do novo grupo, mas é possível editar isso em linha.

  4. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, ou clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu de contexto.

  5. Para desagrupar os valores do campo agrupado, clique com o botão direito do mouse no campo agrupado e selecione Desagrupar no menu de contexto.

Substituir um ou mais valores com Nulo

Caso deseje incluir linhas de dados em sua análise, mas queira excluir determinados valores de campo, basta alterá-los para um valor nulo.

  1. No cartão Perfil, pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (Mac), e selecione os valores que deseja alterar

  2. Clique com o botão direito do mouse ou Ctrl+clique (no Mac) e selecione Substituir com nulo no menu. Os valores são alterados para nulo e o ícone de grupo é mostrado ao lado do valor.

Mapear manualmente vários valores para um valor padrão

Use Agrupar e substituir para mapear valores de um campo entre si ou selecionar manualmente vários valores para agrupá-los. Além disso, é possível adicionar novos valores para definir relações de mapeamento para organizar os dados.

Por exemplo, digamos que você tenha três valores em um campo: Minha Empresa, Minha Empresa Incorporada e Minha Empresa Inc. Todos esses valores representam a mesma empresa, Minha Empresa. É possível usar o editor Agrupar e substituir para mapear os valores Minha Empresa Incorporada e Minha Empresa Inc para Minha Empresa, de forma que os três valores apareçam como Minha Empresa no campo.

Mapear vários valores para um único campo selecionado

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione o valor de campo que deseja usar como o valor de agrupamento. Esse valor agora é exibido na parte superior do painel à direita.

  4. Na seção inferior do painel à direita, no editor Agrupar e substituir, selecione os valores que deseja adicionar ao grupo.

    Para remover valores do grupo, na seção superior do painel à direita, no editor Agrupar e substituir, desmarque a caixa de seleção próxima aos valores.

Selecionar vários valores para criar um grupo

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione vários valores que você queira agrupar.

  4. No painel à direita do editor Agrupar e substituir, clique em Agrupar valores.

    Um novo grupo é criado usando o último valor selecionado como o nome do grupo. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu.

    Adicionar e identificar valores que não estão no conjunto de dados

    Se quiser mapear valores no conjunto de dados a um novo valor não existente, é possível adicioná-lo usando o editor Agrupar e substituir Para identificar com facilidade qualquer valor que não estiver no conjunto de dados, esses valores são marcados com um ponto vermelho próximo ao nome no editor Agrupar e substituir.

    Por exemplo, na imagem abaixo, Wyoming e Nevada não estão no conjunto de dados.

    Alguns motivos para o valor não estar no conjunto de dados incluem os seguintes:

    • Você acabou de adicionar um novo valor manualmente.

    • O valor não está mais nos dados.

    • O valor está nos dados mas não está no conjunto de dados de amostra.

    Para adicionar um novo valor:

    1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

    2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

    3. No painel à esquerda do editor Agrupar e substituir, clique no ícone de adição para adicionar um novo valor.

    4. Digite um novo valor no campo e pressione Enter para adicioná-lo.

    5. No painel à direita, selecione os valores que deseja mapear para o novo valor.

    6. (Opcional) Para adicionar novos valores ao valor mapeado, clique no botão de adição no painel à direita do editor Agrupar e substituir.

Mapear automaticamente os valores para um valor padrão usando uma correspondência parcial

Para pesquisar valores semelhantes e agrupá-los automaticamente, use um dos algoritmos de correspondência difusa. Os valores de campo são agrupados no valor que aparece com mais frequência. Consulte o valores agrupados e adicione ou remova valores no grupo conforme necessário.

Se usar funções de dados para validar os valores de campo, você poderá usar a opção Agrupar e substituir para corresponder valores inválidos e válidos. Para obter mais informações, consulte Agrupar valores semelhantes por função de dados (versão 2019.1.4 e posterior)

Escolha uma das opções a seguir para agrupar valores:

  • Pronúncia: encontre e agrupe valores com sons parecidos. Essa opção usa o algoritmo Metaphone 3, que indexa palavras por suas pronúncias, e é mais adequado para palavras em inglês. Esse tipo de algoritmo é usado por muitos corretores ortográficos populares. Esta opção não está disponível para funções de dados.

  • Caracteres usuais: encontre e agrupe valores que possuem letras ou números em comum. Essa opção usa o algoritmo biométrico ngram, que indexa palavras por seus caracteres únicos depois de remover a pontuação, os duplicados e os espaços em branco. Esse algoritmo funciona para qualquer idioma suportado. Esta opção não está disponível para funções de dados.

    Por exemplo, esse algoritmo corresponderia nomes representados como "John Smith" e "Smith, John", pois ambos geram a chave "hijmnost". Como esse algoritmo não leva em consideração a pronúncia, o valor "Tom Jhinois" teria a mesma chave "hijmnost", e também seria incluído no grupo.

  • Ortografia: encontre e agrupe valores textuais com grafias parecidas. Essa opção usa o algoritmo de distância de Levenshtein para calcular uma distância de edição entre dois valores textuais com o uso de um limite padrão fixo. Ele depois os agrupa quando a distância de edição for menor do que o valor do limite. Esse algoritmo funciona para qualquer idioma suportado.

    A partir do Tableau Prep Builder versão 2019.2.3, esta opção está disponível para uso após a aplicação de uma função de dados. Nesse caso, ele corresponde os valores inválidos ao valor válido mais próximo usando a distância de edição. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original.

  • Pronúncia + Ortografia: (versão 2019.1.4 e posteriores) se você atribuir uma função de dados a seus campos, poderá usá-la para corresponder e agrupar valores com o valor padrão definido pela sua função de dados. Essa opção corresponde os valores inválidos ao valor válido mais semelhante com base na ortografia e na pronúncia. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original. Esta opção é mais adequada para palavras em inglês.

    Para obter mais informações, consulte Limpar e formatar dados.

    Observação: no Tableau Prep Builder versão 2019.1.4 e 2019.2.1 essa opção foi rotulada como Correspondências de função de dados.

Agrupar valores semelhantes usando correspondência difusa

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Caracteres usuais

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. Consulte os agrupamentos, adicione e remova manualmente os valores ou edite-os conforme necessário. Em seguida clique em Concluído.

Ajustar os resultados ao agrupar valores de campo

Se você agrupar valores semelhantes por Ortografia ou Pronúncia, poderá alterar os resultados usando o controle deslizante no campo para ajustar o quão rigorosos são os parâmetros de agrupamento.

Dependendo de como o controle deslizante for definido, é possível ter mais controle sobre o número de valores incluídos em um grupo e o número de grupos que serão criados. Por padrão, o Tableau Prep Builder detecta a configuração de agrupamento ideal e mostra o controle deslizante nessa posição.

Ao alterar o limite, o Tableau Prep Builder analisa uma amostra dos valores para determinar o novo agrupamento. Os grupos gerados pela configuração são salvos e gravados no painel Alterações, mas a configuração de limite não é salva. Na próxima vez que o editor Agrupar e substituir for aberto, para editar a alteração existente ou para fazer uma nova alteração, o controle deslizante de limite será mostrado na posição padrão, permitindo que você faça ajustes com base no conjunto de dados atual.

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. No painel esquerdo do editor Agrupar e substituir, arraste o controle deslizante para um dos cinco níveis de limite para alterar os resultados.

    Para definir um limite mais rigoroso, mova o controle deslizante para a esquerda. Isso resulta em menos correspondências e cria menos grupos. Para definir um limite mais flexível, mova o controle deslizante para a direita. Isso resulta em mais correspondências e cria mais grupos.

  4. Clique em Concluir para salvar as alterações.

Outros artigos nesta seção

Obrigado pelo feedback! Ocorreu um erro ao enviar seu feedback. Tente novamente ou envie-nos uma mensagem..