Limpar e formatar dados

O Tableau Prep Builder fornece várias operações de limpeza que podem ser usadas imediatamente para limpar e formatar os dados. A limpeza de dados sujos facilita a combinação e análise de dados ou a compreensão de outras pessoas em relação aos dados durante o compartilhamento dos conjuntos de dados.

Você também pode limpar os dados usando uma etapa dinâmica ou uma etapa de script para aplicar scripts R ou Python ao fluxo. Para obter mais informações, consulte Dinamizar os dados ou Usar scripts R e Python no fluxo.

Sobre as operações de limpeza

Você limpa seus dados ao aplicar operações de limpeza como filtragem, adição, renomeação, divisão, agrupamento ou remoção de campos. Em versões anteriores, as operações de limpeza só podiam ser executadas no tipo Etapa de limpeza. No Tableau Prep Builder versão 2018.2.1 e posteriores, também é possível executar operações de limpeza na grade de dados em uma etapa de limpeza.

No Tableau Prep Builder versão 2018.3.1 e posteriores, é possível executar operações de limpeza na maioria das etapas do fluxo. Você pode aplicar operações de limpeza limitadas na etapa de entrada e não pode aplicar operações de limpeza na etapa de saída. Para obter mais informações sobre como aplicar operações de limpeza na etapa de entrada, consulte Aplicar operações de limpeza na etapa de entrada.

Operações de limpeza disponíveis

A tabela a seguir mostra quais operações de limpeza estão disponíveis em cada tipo de etapa:

  Entrada Limpeza Agregação Tabela dinâmica União de colunas União de linhas Saída
Filtrar X X X X X X  
Agrupar e substituir   X   X X X  
Limpar   X   X X X  
Dividir valores   X   X X X  
Renomear campo X X X X X X  
Duplicar Campo   X   X X X  
Manter apenas o campo X X X X X X  
Remover campo X X X X X X  
Criar campo calculado   X   X X X  
Editar valor   X   X X X  
Alterar tipo de dados X X X X X X  

Conforme faz alterações nos dados, anotações são adicionadas à etapa correspondente no painel Fluxo e uma entrada é adicionada ao painel Alterações para monitorar suas ações. Se fizer alterações na etapa de entrada, a anotação será mostrada à esquerda da etapa, no painel Fluxo, e ainda será mostrada no Perfil de entrada, na lista de campos.

A ordem em que você aplica mudanças é significativa. As alterações feitas a Agregar, Tabelas dinâmicas, União de colunas e União de linhas são executadas antes ou depois dessas ações de reformulação, dependendo de onde está o campo ao fazer a alteração. O local onde a alteração foi feita é mostrado no painel Alterações da etapa.

O exemplo a seguir mostra uma alteração de campo de uma única tabela em uma etapa de união de colunas. A alteração é realizada antes da ação de união para fornecer os resultados corrigidos.

Ordem das operações

A tabela a seguir mostra onde a ação de limpeza é executada nos tipos de etapa Agregar, Dinamizar, União de colunas e União de linhas, dependendo de onde o campo está na etapa.

Ação Tipo de etapa: Agregação Agregação Tabela dinâmica Tabela dinâmica União de colunas União de colunas União de linhas União de linhas
  Localização do campo: Campos agrupados Campos agregados Não está na tabela de dinâmica Criado a partir da tabela dinâmica Incluído em uma tabela* Incluído nas duas tabelas* Campos incompatíveis Campos combinados
Filtrar   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Agrupar e substituir   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Limpar   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Dividir valores   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Renomear campo   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Duplicar Campo   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Manter apenas o campo   Após a agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Remover campo   Remove da agregação Remove da agregação Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Criar campo calculado   NA NA Antes da dinamização Após a dinamização Após a união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Editar valor   NA NA Antes da dinamização Após a dinamização Antes da união de colunas Após a união de colunas Antes da união de linhas Após a união de linhas
Alterar tipo de dados   Antes da agregação Após a agregação Antes da dinamização Após a dinamização Antes da união de colunas Antes da união de colunas Antes da união de linhas Após a união de linhas

Observação: para união de colunas, se o campo for um campo calculado criado usando um campo de uma tabela, a alteração será aplicada antes da união de colunas. Se o campo for criados com campos de ambas as tabelas, a alteração será aplicada depois da união.

Aplicar operações de limpeza

Para aplicar operações de limpeza a campos, use as opções da barra de ferramentas ou clique em Mais opções no cartão Perfil do campo, na grade de dados ou no painel Resultados para abrir o menu.

Nos tipos de etapas Agregar, Dinamizar, Unir colunas e Unir linhas, o menu Mais opções está disponível nos cartões de perfil do painel Resultados e grade de dados correspondente. Se você realizar as mesmas operações ou ações de limpeza repetidamente em todo o fluxo, poderá copiar e colar etapas, ações ou até mesmo campos. Para obter mais informações, consulte Copiar etapas, ações e campos.

Barra de ferramentas do painel Perfil Menu suspenso

Selecionar sua exibição

Você pode executar operações de limpeza fora do painel de perfil ou de resultados na grade de dados ou na exibição de lista. Use a barra de ferramentas de exibição (versão 2019.3.2 e posterior) para alterar a exibição e clique em Mais opções em um campo para abrir o menu de limpeza.

  • Mostrar painel Perfil : este é o modo de exibição padrão. Selecione este botão para voltar à exibição do painel Perfil ou do painel Resultados.

  • Mostrar grade de dados : recolher o perfil ou painel de resultados para expandir e mostrar apenas a grade de dados. Essa exibição fornece uma exibição mais detalhada de seus dados e pode ser útil quando você precisa trabalhar com valores de campo específicos. Depois de selecionar essa opção, esse estado de exibição persiste em todas as etapas do seu fluxo, mas você pode alterá-lo a qualquer momento.

    Observação: nem todas as operações de limpeza estão disponíveis na grade de dados. Por exemplo, caso deseje editar um valor em linha, você deve fazer isso no painel Perfil.

  • Mostrar exibição de lista (versão 2019.3.2 e posterior): Converta o painel Perfil ou o painel Resultados em uma lista. Depois de selecionar essa opção, esse estado de exibição persiste em todas as etapas do seu fluxo, mas você pode alterá-lo a qualquer momento.

    Você pode selecionar várias linhas e clicar no X para removê-las ou usar o menu Mais opções para aplicar operações aos campos selecionados. Se você atribuir uma função de dados ao campo ou selecionar Filtrar, Agrupar e substituir, Limparou Dividir valores, você será retornado à exibição de Perfil ou Resultados para concluir essas ações. Todas as outras opções podem ser executadas na exibição de lista.

Versão 2019.3.1 e anteriores

Você pode aplicar operações de limpeza na grade de dados na etapa de limpeza. Basta clicar no botão Ocultar painel Perfil para recolher o painel Perfil e, em seguida, clicar em Mais opções em um campo para abrir o menu.

Aplicar operações de limpeza

Para aplicar operações de limpeza a um campo, faça o seguinte:

Observação: você pode executar operações de limpeza em uma exibição de lista começando na versão 2019.3.2.

  1. No painel Perfil, grade de dados, painel Resultados ou na exibição de lista, selecione o campo que deseja alterar.

  2. Na barra de ferramentas ou no menu Mais opções do campo, selecione uma das opções a seguir:

    • Filtrar ou Filtrar valores: selecione uma das opções de filtro, clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) em um valor de campo para manter ou excluir valores. Você também pode usar o filtro Valores selecionados para selecionar e escolher os valores a serem filtrados, incluindo os valores que não estão no seu exemplo de fluxo. Para obter mais informações sobre as opções de filtro, consulte Filtrar dados.

    • Agrupar e substituir: selecione manualmente os valores ou use o agrupamento automático. Além disso, é possível selecionar vários valores no cartão Perfil e clicar com o botão direito do mouse ou manter a tecla Ctrl pressionada (MacOS) e clicar para agrupar ou desagrupar valores ou editar o valor do grupo. Para obter mais informações sobre como utilizar Agrupar e substituir, consulte Mapear automaticamente os valores para um valor padrão usando uma correspondência parcial.

    • Limpar: selecione de uma lista de operações rápidas de limpeza para aplicar a todos os valores no campo.

    • Dividir valores: dividir valores automaticamente com base em um separador comum ou usar divisão personalizada para especificar como deseja dividir valores de campo.

      Divisões automáticas e personalizadas funcionam da mesma maneira no Tableau Desktop. Para obter mais informações, consulte Dividir um campo em vários campos na Ajuda para criação na Web e do Tableau Desktop.

    • Renomear campo

    • Campo Duplicado (versão 2019.2.3 e posterior) Crie uma cópia do campo e dos valores.

    • Manter apenas o campo(versão 2019.2.2 e posterior)

    • Criar campo calculado

    • Remover (Remover campo nas versões anteriores)

      Observação: a partir da versão 2019.3.1, você pode usar a opção Publicar como função de dados para criar funções de dados personalizadas que podem ser aplicadas aos campos, para validar os valores de campo na limpeza dos dados. Para obter mais informações sobre essa opção, consulte Criar funções de dados personalizadas (versão 2019.3.1 e posterior).

  3. Para editar um valor, clique com o botão direito do mouse ou pressione Ctrl e clique (MacOS) em um ou mais valores, selecione Editar valor e insira um novo valor. Além disso, é possível selecionar Substituir com nulo para substituir os valores com um valor nulo ou clicar duas vezes em um único valor para editá-lo diretamente. Para obter mais informações sobre como editar valores de campo, consulte Editar valores de campo.

  4. Consulte os resultados dessas operações no painel Perfil, painéis Resumo ou na grade de dados.

Visualizar suas alterações

Os diferentes tipos de operações de limpeza são representados por ícones nas etapas do fluxo. Caso mais de quatro tipos de operações sejam aplicados a uma etapa, uma elipse será exibida na etapa. Passe o cursor sobre esses ícones para exibir as anotações que mostram as operações aplicadas e a ordem na qual são executadas.

A partir do Tableau Prep Builder versão 2019.1.3 e posteriores, você pode clicar em uma anotação no ícone de alteração em uma etapa no painel Fluxo ou em um cartão de perfil no painel Perfil ou Resultados, e a alteração e o campo afetados serão realçados no painel Alterações e no painel Perfil ou Resultados.

Além disso, é possível selecionar uma etapa e expandir o painel Alterações para exibir os detalhes de cada alteração, editar ou removê-las, ou arrastá-las para cima e para baixo para trocar a ordem em que serão aplicadas. No Tableau Prep Builder versão 2019.1.1, você pode adicionar uma descrição para fornecer contexto para outros usuários. Para obter mais informações sobre como adicionar descrições às alterações, consulte Adicionar descrições a etapas de fluxo e ações de limpeza

Anotação de limpeza Painel Alterações

Ao visualizar alterações em uma etapa Agregar, Dinamizar, União de colunas ou União de linhas, a ordem em que a alteração é aplicada é mostrada antes ou depois da ação de reformulação. A ordem dessas alterações é aplicada pelo sistema e não pode ser alterada. É possível editar e remover a alteração.

Mesclar campos

Se você tiver campos que contêm os mesmos valores nomeados de forma diferente, é possível mesclá-los em um campo para agrupá-los, arrastando um campo até o outro. Ao mesclar os campos, o campo de destino se torna o campo primário e o nome do campo de destino permanece o mesmo. O campo mesclado ao campo de destino é removido.

Exemplo:

Uma união de linhas curinga resulta em 3 campos com os mesmos valores Mesclar 3 filtros em 1

Ao mesclar os campos, o Tableau Prep Builder mantém todos os campos do campo de destino e substitui todos os nulos dele por valores de campos de origem mesclados com o campo de destino. Os campos de origem são removidos.

Exemplo

Nome Contact_Phone Business_Phone Cell_Phone Home_Phone
Bob 123-4567 123-4567 nulo nulo
Sally nulo nulo 456-7890 789-0123
Fred nulo nulo nulo 567-8901
Emma nulo 234-5678 345-6789 nulo

Se você mesclar os campos Business _Phone, Cell_Phone e Home_Phone com o campo Contact_phone, os outros campos serão removidos e resultarão no seguinte:

Nome Contact_Phone
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

Para mesclar campos, execute uma das ações a seguir:

  • Arraste e solte um campo no outro. Um indicador Soltar para mesclar campos é exibido.

  • Selecione vários arquivos e clique com o botão direito do mouse na seleção para abrir o menu de contexto, em seguida clique em Mesclar campos.

  • Selecione vários campos e clique em Mesclar campos na barra de ferramentas.

Para obter informações sobre como corrigir campos sem correspondência devido a uma união de linhas, consulte Corrigir campos sem correspondência.

Aplicar operações de limpeza usando recomendações (versão 2018.3.2 e posterior)

Às vezes, pode ser difícil identificar qual operação de limpeza será necessária para corrigir problemas nos dados. O Tableau Prep Builder pode analisar os dados e recomendar operações de limpeza que podem ser aplicadas automaticamente para corrigir com rapidez os problemas nos campos de dados ou ajudar a identificar problemas para corrigi-los. Esse recurso está disponível em todos os tipos de etapas, exceto em Entrada, Saída e Unir colunas.

Observação: se não quiser usar esse recurso, é possível desativá-lo. No menu superior, acesse Ajuda > Configurações e desempenho. Em seguida, clique em Habilitar recomendações para desmarcar a caixa de seleção ao lado da configuração.

Os tipos de recomendação incluem:

  • Funções de dados

  • Filtrar

  • Agrupar e substituir (também se aplica a campos com funções de dados começando na versão 2019.2.3)
  • Dinamizar colunas para linhas (2019.4.2 e posterior)

  • Substituir valores por valores nulos
  • Remover campos

  • Split (versão 2019.1.1 e posterior)

    Observação: essa opção funciona especificamente com dados em arquivos de texto de largura fixa. Para usar a recomendação de divisão com esse tipo de arquivo, após conectar-se à fonte de dados, na etapa de entrada, na guia Configurações de texto, selecione um caractere de Separador de campo que não esteja sendo usado nos dados, para que eles sejam carregados como um campo único.

  • Cortar espaços

Aplicar recomendações

  1. Execute um destes procedimentos:

    • Clique no ícone de lâmpada no canto superior direito do cartão Perfil.
    • Na barra de ferramentas, clique na seta suspensa Recomendações para exibir todas as recomendações referentes a seu conjunto de dados e selecione uma recomendação na lista.

    Essa opção é exibida somente quando as alterações recomendadas são identificadas pelo Tableau Prep Builder.

  2. Para aplicar a recomendação, passe o mouse sobre o cartão Recomendações e clique em Aplicar.

    A alteração é aplicada automaticamente e uma entrada é adicionada ao painel Alterações. Para remover uma Alteração, clique em Desfazer no menu superior ou passe o mouse sobre a alteração no painel Alterações e clique no X para removê-la.

    Se você aplicar uma recomendação para dinamizar campos (versão 2019.4.2 e posterior), uma etapa de dinamização será criada automaticamente, onde é possível realizar quaisquer ações de dinamização adicionais, como renomear os campos dinamizados ou dinamizar campos adicionais.

  3. Se o Tableau Prep Builder identificar recomendações adicionais como resultado da alteração, o ícone de lâmpada permanecerá no cartão Perfil até que nenhuma recomendação adicional seja encontrada.

    Repita as etapas acima para aplicar quaisquer alterações adicionais ou ignorar a alteração sugerida e usar as outras ferramentas de limpeza no Tableau Prep Builder para solucionar os problemas de dados.

Editar valores de campo

Diversas variações do mesmo valor podem impedir um resumo preciso dos dados. É possível corrigir essas variações de forma rápida e fácil usando as opções a seguir no Tableau Prep Builder.

Observação: qualquer edição feita no valores devem ser compatíveis com o tipo de dados do campo.

Editar valor único

  1. No cartão Perfil, clique no valor que deseja editar e insira o novo valor. Um ícone de agrupamento aparece próximo ao valor.

    Como alternativa, clique com o botão direito do mouse e, em seguida, clique em Editar valor. A alteração é gravada no painel Alterações, no lado esquerdo da tela.

  2. Consulte os resultados no painel Perfil e na grade de dados.

Editar vários valores

Há várias opções para a edição de vários valores de uma só vez. Por exemplo, use operações rápidas de limpeza para remover a pontuação em todos os valores de um campo, agrupe valores manualmente ao usar a seleção múltipla, agrupe valores automaticamente ao usar algoritmos de correspondência nebulosa que encontram valores similares ou selecione vários valores e os substitua por Nulo.

Observação: ao mapear vários valores em um só, o campo original mostra um ícone de agrupamento próximo ao valor, que mostra quais valores estão agrupados.

Editar vários valores usando operações rápidas de limpeza

Esta opção se aplica apenas a campos de texto.

  1. No painel Perfil ou Resultados, ou na grade de dados, selecione o campo que deseja editar.

  2. Clique em Mais opções, selecione Limpar, em seguida selecione uma das opções a seguir:

    • Tornar letras maiúsculas: altera todos os valores de texto em letras maiúsculas.

    • Tornar letras minúsculas: altera todos os valores de texto em letras minúsculas.

    • Remover letras: remove todas as letras e deixe apenas outros caracteres.

    • Remover números: remove todos os números e deixa apenas letras e outros caracteres.

    • Remover pontuação: remove toda a pontuação.

    • Cortar espaços: remove espaços à esquerda e à direita.

    É possível empilhar operações para aplicar várias operações de limpeza nos campos. Por exemplo, primeiro selecione Limpar > Remover números, em seguida selecione Limpar > Remover pontuação para remover todos os números e pontuação dos valores de campo.

  3. Para desfazer as alterações, clique na seta Desfazer, na parte superior do painel Fluxo, ou remova a alteração da lista de alterações.

Agrupar e editar vários valores embutidos

  1. No cartão Perfil, selecione o campo que deseja editar.

  2. Pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (MacOS), e selecione os valores que deseja agrupar.

  3. Clique com o botão direito do mouse e selecione Agrupar no menu de contexto. O valor da seleção clicada com o botão direito do mouse se torna o nome padrão do novo grupo, mas é possível editar isso em linha.

  4. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, ou clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu de contexto.

  5. Para desagrupar os valores do campo agrupado, clique com o botão direito do mouse no campo agrupado e selecione Desagrupar no menu de contexto.

Substituir um ou mais valores com Nulo

Caso deseje incluir linhas de dados em sua análise, mas queira excluir determinados valores de campo, basta alterá-los para um valor nulo.

  1. No cartão Perfil, pressione a tecla Ctrl ou Shift+clique, ou Command ou Shift+clique (Mac), e selecione os valores que deseja alterar

  2. Clique com o botão direito do mouse ou Ctrl+clique (no Mac) e selecione Substituir com nulo no menu. Os valores são alterados para nulo e o ícone de grupo é mostrado ao lado do valor.

Mapear manualmente vários valores para um valor padrão

Use Agrupar e substituir para mapear valores de um campo entre si ou selecionar manualmente vários valores para agrupá-los. Além disso, é possível adicionar novos valores para definir relações de mapeamento para organizar os dados.

Por exemplo, digamos que você tenha três valores em um campo: Minha Empresa, Minha Empresa Incorporada e Minha Empresa Inc. Todos esses valores representam a mesma empresa, Minha Empresa. É possível usar o editor Agrupar e substituir para mapear os valores Minha Empresa Incorporada e Minha Empresa Inc para Minha Empresa, de forma que os três valores apareçam como Minha Empresa no campo.

Mapear vários valores para um único campo selecionado

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione o valor de campo que deseja usar como o valor de agrupamento. Esse valor agora é exibido na parte superior do painel à direita.

  4. Na seção inferior do painel à direita, no editor Agrupar e substituir, selecione os valores que deseja adicionar ao grupo.

    Para remover valores do grupo, na seção superior do painel à direita, no editor Agrupar e substituir, desmarque a caixa de seleção próxima aos valores.

Selecionar vários valores para criar um grupo

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

  3. No painel à esquerda do editor Agrupar e substituir, selecione vários valores que você queira agrupar.

  4. No painel à direita do editor Agrupar e substituir, clique em Agrupar valores.

    Um novo grupo é criado usando o último valor selecionado como o nome do grupo. Para editar o nome do grupo, selecione o campo agrupado e edite o valor, clique com o botão direito do mouse ou pressione Ctrl + clique (no Mac) no campo agrupado e selecione Editar valor no menu.

    Adicionar e identificar valores que não estão no conjunto de dados

    Se quiser mapear valores no conjunto de dados a um novo valor não existente, é possível adicioná-lo usando o editor Agrupar e substituir Para identificar com facilidade qualquer valor que não estiver no conjunto de dados, esses valores são marcados com um ponto vermelho próximo ao nome no editor Agrupar e substituir.

    Por exemplo, na imagem abaixo, Wyoming e Nevada não estão no conjunto de dados.

    Alguns motivos para o valor não estar no conjunto de dados incluem os seguintes:

    • Você acabou de adicionar um novo valor manualmente.

    • O valor não está mais nos dados.

    • O valor está nos dados mas não está no conjunto de dados de amostra.

    Para adicionar um novo valor:

    1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

    2. Clique em Mais opções e selecione Agrupar e substituir > Seleção manual no menu de contexto.

    3. No painel à esquerda do editor Agrupar e substituir, clique no ícone de adição para adicionar um novo valor.

    4. Digite um novo valor no campo e pressione Enter para adicioná-lo.

    5. No painel à direita, selecione os valores que deseja mapear para o novo valor.

    6. (Opcional) Para adicionar novos valores ao valor mapeado, clique no botão de adição no painel à direita do editor Agrupar e substituir.

Mapear automaticamente os valores para um valor padrão usando uma correspondência parcial

Para pesquisar valores semelhantes e agrupá-los automaticamente, use um dos algoritmos de correspondência difusa. Os valores de campo são agrupados no valor que aparece com mais frequência. Consulte o valores agrupados e adicione ou remova valores no grupo conforme necessário.

Se usar funções de dados para validar os valores de campo, você poderá usar a opção Agrupar e substituir para corresponder valores inválidos e válidos. Para obter mais informações, consulte Agrupar valores semelhantes por função de dados

Escolha uma das opções a seguir para agrupar valores:

  • Pronúncia: encontre e agrupe valores com sons parecidos. Essa opção usa o algoritmo Metaphone 3, que indexa palavras por suas pronúncias, e é mais adequado para palavras em inglês. Esse tipo de algoritmo é usado por muitos corretores ortográficos populares. Esta opção não está disponível para funções de dados.

  • Caracteres usuais: encontre e agrupe valores que possuem letras ou números em comum. Essa opção usa o algoritmo biométrico ngram, que indexa palavras por seus caracteres únicos depois de remover a pontuação, os duplicados e os espaços em branco. Esse algoritmo funciona para qualquer idioma suportado. Esta opção não está disponível para funções de dados.

    Por exemplo, esse algoritmo corresponderia nomes representados como "John Smith" e "Smith, John", pois ambos geram a chave "hijmnost". Como esse algoritmo não leva em consideração a pronúncia, o valor "Tom Jhinois" teria a mesma chave "hijmnost", e também seria incluído no grupo.

  • Ortografia: encontre e agrupe valores textuais com grafias parecidas. Essa opção usa o algoritmo de distância de Levenshtein para calcular uma distância de edição entre dois valores textuais com o uso de um limite padrão fixo. Ele depois os agrupa quando a distância de edição for menor do que o valor do limite. Esse algoritmo funciona para qualquer idioma suportado.

    A partir do Tableau Prep Builder versão 2019.2.3, esta opção está disponível para uso após a aplicação de uma função de dados. Nesse caso, ele corresponde os valores inválidos ao valor válido mais próximo usando a distância de edição. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original.

  • Pronúncia + Ortografia: (versão 2019.1.4 e posteriores) se você atribuir uma função de dados a seus campos, poderá usá-la para corresponder e agrupar valores com o valor padrão definido pela sua função de dados. Essa opção corresponde os valores inválidos ao valor válido mais semelhante com base na ortografia e na pronúncia. Se o valor padrão não estiver em sua amostra do conjunto de dados, o Tableau Prep Builder vai adicioná-lo automaticamente e marcá-lo como não existente no conjunto de dados original. Esta opção é mais adequada para palavras em inglês.

    Para obter mais informações, consulte Limpar e formatar dados.

    Observação: no Tableau Prep Builder versão 2019.1.4 e 2019.2.1 essa opção foi rotulada como Correspondências de função de dados.

Agrupar valores semelhantes usando correspondência difusa

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Caracteres usuais

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. Consulte os agrupamentos, adicione e remova manualmente os valores ou edite-os conforme necessário. Em seguida clique em Concluído.

Ajustar os resultados ao agrupar valores de campo

Se você agrupar valores semelhantes por Ortografia ou Pronúncia, poderá alterar os resultados usando o controle deslizante no campo para ajustar o quão rigorosos são os parâmetros de agrupamento.

Dependendo de como o controle deslizante for definido, é possível ter mais controle sobre o número de valores incluídos em um grupo e o número de grupos que serão criados. Por padrão, o Tableau Prep Builder detecta a configuração de agrupamento ideal e mostra o controle deslizante nessa posição.

Ao alterar o limite, o Tableau Prep Builder analisa uma amostra dos valores para determinar o novo agrupamento. Os grupos gerados pela configuração são salvos e gravados no painel Alterações, mas a configuração de limite não é salva. Na próxima vez que o editor Agrupar e substituir for aberto, para editar a alteração existente ou para fazer uma nova alteração, o controle deslizante de limite será mostrado na posição padrão, permitindo que você faça ajustes com base no conjunto de dados atual.

  1. No painel Perfil ou Resultados, selecione o campo que deseja editar.

  2. Clique em Mais opções e selecione Agrupar e substituir e, em seguida, selecione uma das opções a seguir:

    • Pronúncia

    • Ortografia

    O Tableau Prep Builder encontra e agrupa valores correspondentes e os substitui pelo valor que ocorre com mais frequência no grupo.

  3. No painel esquerdo do editor Agrupar e substituir, arraste o controle deslizante para um dos cinco níveis de limite para alterar os resultados.

    Para definir um limite mais rigoroso, mova o controle deslizante para a esquerda. Isso resulta em menos correspondências e cria menos grupos. Para definir um limite mais flexível, mova o controle deslizante para a direita. Isso resulta em mais correspondências e cria mais grupos.

  4. Clique em Concluir para salvar as alterações.

Outros artigos nesta seção

Agradecemos seu feedback! Ocorreu um erro ao enviar o feedback. Tente novamente ou envie-nos uma mensagem.