Configurar o conjunto de dados

Observação: a partir da versão 2020.4.1, é possível criar e editar fluxos no Tableau Server e Tableau Online. O conteúdo deste tópico se aplica a todas as plataformas, salvo observação específica. Para obter mais informações sobre os fluxos de criação na Web, consulte Tableau Prep na Web.

Para determinar quanto de seu conjunto de dados incluir no fluxo, é possível configurá-lo. Quando você se conecta aos seus dados ou arrasta tabelas para o painel Fluxo, uma etapa de entrada é adicionada automaticamente ao fluxo. Ela sempre será a primeira etapa no fluxo. É possível clicar com o botão direito do mouse na etapa de entrada para renomear ou removê-la. Se estiver conectado a um arquivo de texto do Excel, também é possível atualizar os dados da etapa de entrada. Para obter mais informações sobre como atualizar os dados na etapa de entrada, consulte Adicionar mais dados na etapa de entrada(O link abre em nova janela).

Na etapa de entrada, é possível ver os detalhes sobre o conjunto de dados. Aqui você pode pesquisar por campos, ver valores de amostra e executar ações para reduzir o tamanho do conjunto dados, tais como selecionar os campos a serem incluídos, selecionar a amostra de dados com a qual trabalhar ou aplicar filtros a campos ou linhas selecionados. Você também pode configurar as propriedades do campo alterando o nome do campo ou definindo as configurações de texto para arquivos de texto.

Você também pode alterar o tipo de dados na etapa de Entrada para conexões de dados compatíveis. Estão inclusos o Microsoft Excel, arquivos de texto e PDF e dados do Box, Dropbox, Google Drive e OneDrive. Para outras fontes de dados, você pode alterar o tipo de dados em uma etapa de limpeza. Para obter mais informações, consulte Consultar os tipos de dados atribuídos aos seus dados.

Observação: valores de campo que incluam colchetes serão convertidos automaticamente em parenteses.

Conectar a uma consulta SQL personalizada

Se seu banco de dados for compatível com o uso do SQL personalizado, você verá SQL personalizado exibido próximo à parte inferior do painel Conexões. Clique duas vezes em SQL personalizado para abrir a guia SQL personalizado, onde poderá inserir consultas para pré-selecionar dados e usar operações específicas da fonte. Depois que a consulta recuperar o conjunto de dados, é possível selecionar os campos a serem incluídos, aplicar filtros ou alterar o tipo de dados antes de adicionar os dados ao fluxo.

Para obter mais informações sobre o uso de SQL personalizado, consulte Usar SQL personalizado para conectar-se aos dados..

Aplicar operações de limpeza na etapa de entrada

Apenas algumas operações de limpeza estão disponíveis em uma etapa de entrada. Qualquer uma das alterações a seguir é permitida na lista Campo de entrada. Suas alterações são monitoradas no painel Alterações e as anotações são adicionadas à etapa de entrada no painel Fluxo e na lista Campo de entrada.

  • Filtrar: clique em Filtrar valores na barra de ferramentas e insira seu critério de filtragem no editor de cálculo.

  • Renomear campo: no campo Nome de campo, clique duas vezes ou pressione Ctrl e clique (MacOS) no nome do campo e insira um novo nome.

  • Alterar tipo de dados: clique no tipo de dados do campo e selecione um novo tipo de dados no menu.

  • Remover campo: desmarque a caixa de seleção ao lado dos campos que não deseja incluir no fluxo.

Selecionar os campos a serem incluídos no fluxo

O painel Entrada mostra uma lista de campos em seu conjunto de dados. É possível usar o campo Pesquisa para encontrar campos na lista e depois usar as caixas de seleção para selecionar os campos a serem incluídos ou excluídos. Para incluir ou excluir todos os campos do fluxo, alterne a caixa de seleção na parte superior da grade.

Aplicar filtros a campos na etapa de entrada

Para filtrar um campo, faça o seguinte:

  1. Na barra de ferramentas, clique em Filtrar valores.

  2. Insira o critério de filtragem no editor de cálculo.

O tipo de filtro de cálculo é a única opção de filtro disponível na etapa de entrada. Outras opções de filtro estão disponíveis em outros tipos de etapa. Para obter mais informações, consulte Filtrar dados(O link abre em nova janela).

Alterar nomes de campo

Para alterar o nome de um campo, na coluna Nome de campo, selecione o nome, em seguida digite o novo nome no campo. Uma anotação é adicionada na grade do campo e no painel Fluxo à esquerda da etapa de entrada. As alterações também serão rastreadas no painel Alterações.

Alterar tipos de dados

Para alterar o tipo de dados de um campo, realize as ações a seguir:

  1. Clique no tipo de dados do campo.

  2. Selecione o novo tipo de dados no menu.

    Você também pode alterar o tipo de dados para campos em outros tipos de etapa no fluxo ou atribuir funções de dados para ajudar a validar os valores de campo. Para obter mais informações sobre como alterar o tipo de dados ou usar funções de dados, consulte Consultar os tipos de dados atribuídos aos seus dados(O link abre em nova janela) e Usar funções de dados para validar seus dados(O link abre em nova janela).

Configurar propriedades de campo

Ao trabalhar com arquivos de texto, você verá uma guia Configurações onde é possível editar a conexão e configurar as propriedades de texto, como o separador de campo para arquivos de texto. Também é possível editar a conexão do arquivo no painel Conexões ou configurar atualizações incrementais. Para obter mais informações sobre como configurar atualização incremental para o fluxo, consulte Atualizar dados de fluxo usando a atualização incremental.

Ao trabalhar com arquivos de texto e Excel, é possível corrigir os tipos de dados que foram inferidos incorretamente antes mesmo de iniciar o fluxo. Os tipos de dados sempre poderão ser alterados nas etapas subsequentes do painel Perfil após iniciar o fluxo.

Configurar definições de texto em arquivos de texto

Para alterar as configurações usadas na analise de arquivos de texto, selecione das opções a seguir:

  • A primeira linha contém o cabeçalho (padrão): selecione esta opção para usar a primeira linha como os rótulos de campo.

  • Gerar nomes de campo automaticamente: selecione esta opção se desejar que o Tableau Prep Builder gere os cabeçalhos de campo automaticamente. A convenção de nomenclatura do campo segue o mesmo modelo do Tableau Desktop. Por exemplo F1, F2 e assim por diante.

  • Separador de campo: selecione um caractere da lista para usar na separação de colunas. Selecione Outro para inserir um caractere personalizado.

  • Qualificador de texto: selecione o caractere que contenha os valores no arquivo.

  • Conjunto de caracteres: selecione um conjunto de caracteres que descreva a codificação do arquivo de texto.

  • Localidade: selecione a localidade a ser usada para pesquisar por arquivos. Essa configuração indica qual separador de decimal e milhar usar.

Definir o tamanho da amostra de dados

Por padrão, o Tableau Prep limita os dados incluídos no fluxo a uma amostra representativa de seu conjunto de dados para manter um alto desempenho. A amostra de dados é determinada pelo cálculo do número ideal de linhas baseado no número total de campos no conjunto de dados e os tipos de dados desses campos. Em seguida, o Tableau Prep recupera o número principal de linhas da quantidade calculada da forma mais rápida possível.

A amostra de dados resultante pode incluir ou não todas as linhas necessárias, dependendo de como ela foi calculada e retornada. Caso não veja os dados esperados, é possível alterar as configurações da amostra de dados para executar a consulta novamente.

Ao criar ou editar fluxos na Web, os limites são aplicados à quantidade de dados que podem ser incluídas em um fluxo, e as opções disponíveis para alterar sua amostra de dados são ligeiramente diferentes de quando se trabalha no Tableau Prep Builder. Para obter mais informações, consulte Dados de amostra e limites de processamento.

Observação: se seus dados forem de amostra, um selo de Amostra será exibido no painel Perfil e persistirá em cada etapa adicionada. Qualquer alteração feita será aplicada à amostra com a qual estiver trabalhando no fluxo. Todas as alterações se aplicarão a todo o conjunto de dados ao executar o fluxo.

Para alterar as configurações da amostra de dados, selecione uma etapa de entrada, em seguida, na guia Amostra de dados, selecione uma das opções a seguir:

  • Quantidade de amostra padrão (padrão): o Tableau Prep calcula o número total de linhas a serem retornadas.

  • Usar todos os dados: (apenas no Tableau Prep Builder) recupera todas as linhas em seus dados independentemente do tamanho. Isso poderá afetar o desempenho ou fará com que o Tableau Prep Builder atinja o tempo limite.

    Observação: para manter o desempenho, mesmo que você selecione essa configuração, um limite de amostra de dados de 1 milhão de linhas é aplicado aos tipos de etapa Agregar e Unir linhas, e um limite de amostra de dados de 3 milhões de linhas é aplicado aos tipos Unir colunas e Dinamizar.

  • Número corrigido de linhas: selecione o número de linhas a serem retornados do conjunto de dados. O número recomendado de linhas é de até 1 milhão. Definir o número de linhas para mais de 1 milhão pode afetar o desempenho.

    • Em criação na Web: o número máximo de linhas que um usuário pode selecionar ao usar grandes conjuntos de dados é configurado pelo administrador. Como usuário, você pode selecionar o número de linhas até esse limite.
  • Seleção rápida (padrão): o banco de dados retorna o número de linhas solicitado da forma mais rápida possível. Esse pode ser o primeiro número N de linhas ou as linhas que o banco de dados armazenou em cache na memória de uma consulta anterior.

  • Amostra aleatória: o banco de dados retorna o número de linhas solicitado mas olha cada linha no conjunto de dados e retorna uma amostra representativa de todas elas. Essa opção pode afetar o desempenho quando os dados são recuperados em um primeiro momento.

Agradecemos seu feedback!