Amazon S3

Este artigo descreve como conectar o Tableau ao conector Amazon S3 sem driver e configurar a fonte de dados.

Antes de começar

Antes de começar, colete as seguintes informações de conexão:

  • A região da AWS do seu bucket S3.

  • O nome do bucket S3.

  • Sua chave de acesso AWS IAM para seu bucket S3 (ID da chave e chave de acesso secreta).

Permissões

Certifique-se de que seu usuário de AWS IAM tenha permissões de leitura para seu bucket S3.

Recomendações

As recomendações a seguir podem ajudar a aumentar o desempenho.

  • O desempenho ideal será alcançado se o cliente estiver executando em um ambiente AWS (por exemplo, Tableau Desktop ou Server instalado em uma instância do EC2 ou usando o Tableau Cloud).
  • O suporte de bucket entre regiões funciona, mas o desempenho será pior do que o acesso à mesma região. Pode haver custo adicional devido às taxas de saída de dados.

Fazer a conexão e configurar a fonte de dados

  1. Inicie o Tableau e, em Conectar, selecione Amazon S3 na lista de Conectores adicionais.
  2. Selecione Instalar e reiniciar o Tableau para instalar o conector.
  3. Após a reinicialização do Tableau, acesse Conectare selecione Amazon S3 na lista de conectores instalados.
  4. Insira a região do bucket, o nome do bucket, a ID da chave de acesso e a chave de acesso secreta.
  5. Selecione Fazer logon.
  6. No conteúdo do seu bucket, selecione um arquivo ao qual deseja se conectar.
  7. Selecione Conectar.

Configurar a fontes de dados

Conclua as etapas a seguir para configurar a fonte de dados.

  1. (Opcional) Selecione o nome da fonte de dados padrão na parte superior da página.
  2. Insira um nome de fonte de dados exclusivo para uso no Tableau.
  3. Arraste um ou mais arquivos aos quais deseja se conectar do painel esquerdo para o canvas.
  4. Para iniciar sua análise, selecione a guia Planilha 1.

Unir linhas de dados

Você pode unir linhas de arquivos no seu bucket S3. Para obter mais informações sobre a união de linhas, consulte Unir linhas de dados. Para realizar uma união de linhas curinga que inclua arquivos em subpastas, a pasta raiz ou o bucket deve ter pelo menos um arquivo, que corresponda à estrutura dos arquivos contidos em subpastas, para incluir na união de linhas. Esse é o primeiro arquivo ao qual você se conecta ao criar a união de linhas.

Problemas conhecidos e limitações

As seções a seguir têm problemas conhecidos são que podem afetar o seu sucesso ao usar o conector Amazon S3.

Observação: esse conector não é compatível com a Criação na Web do Tableau Prep ou com conexões virtuais.

Problemas conhecidos e limitações da autenticação
  • Somente a autenticação de chave secreta/chave de acesso do usuário do Amazon IAM sem token de sessão é compatível.

Publicar problemas conhecidos e limitações
  • Pastas de trabalho e fontes de dados devem ser publicadas usando a opção de autenticação 'Senha inserida'. 'Avisar usuário' não é compatível no momento.

Problemas conhecidos e limitações da união de linhas
  • Somente o Tableau Desktop é compatível com uma união de linhas curinga.
  • A Criação na Web oferece suporte apenas à união de linhas manual definida pelo usuário (arrastar arquivos).
Problemas conhecidos e limitações do tipo de arquivo
  • Arquivos Parquet, .csv, .gz compactados e do Excel são compatíveis no momento.
  • Todos os dados são, por design, importados em formato de cadeia de caracteres.
  • Você não pode unir linhas ou unir colunas em vários tipos de arquivo em uma única conexão (por exemplo, Parquet e .csv juntos).
  • Atualmente, apenas arquivos .csv delimitados por vírgulas são compatíveis.
  • O limite de tamanho do arquivo é 15 GB.
  • O conjunto de resultados cumulativos de uma união de colunas ou união de linhas não pode exceder 15 GB.
  • Atualmente, os arquivos do Excel não podem exceder ~100 mb devido a problemas de desempenho com o analisador de arquivos do Excel no conector.
Problemas conhecidos e limitações adicionais do arquivo Parquet
  • Os arquivos Parquet devem estar no formato descrito em nossa Documentação da API do Hyper.
  • Colunas aninhadas e, portanto, os tipos aninhados MAP e LIST não são compatíveis.
  • Os tipos BSON, UUID e ENUM não são compatíveis.
  • O tipo físico FIXED_LEN_BYTE_ARRAY sem qualquer tipo lógico ou convertido não é compatível.
  • O tipo DECIMAL só é compatível até 8 bytes (18 dígitos decimais). Considere usar o dobro se precisar de mais de 18 dígitos decimais.
  • Os tipos TIME_MILLIS e TIME_NANOS não são compatíveis. Considere usar TIME_MICROS em vez disso.
  • A codificação obsoleta BIT_PACKED não é compatível. Nenhum arquivo Parquet recente deve usar essa codificação, pois ela está obsoleta há mais de meia década.
  • A codificação DELTA_LENGTH_BYTE_ARRAY e a recente codificação BYTE_STREAM_SPLIT não são compatíveis, pois não são escritas por nenhuma biblioteca. Se você encontrar um arquivo Parquet usando essas codificações, informe-nos.
  • As compactações compatíveis são SNAPPY, GZIP, ZSTD e LZ4_RAW.

Consulte também