Amazon S3
Este artigo descreve como conectar o Tableau ao conector Amazon S3 sem driver e configurar a fonte de dados.
Antes de começar, colete as seguintes informações de conexão:
A região da AWS do seu bucket S3.
O nome do bucket S3.
Sua chave de acesso AWS IAM para seu bucket S3 (ID da chave e chave de acesso secreta).
Permissões
Certifique-se de que seu usuário de AWS IAM tenha permissões de leitura para seu bucket S3.
Recomendações
As recomendações a seguir podem ajudar a aumentar o desempenho.
- O desempenho ideal será alcançado se o cliente estiver executando em um ambiente AWS (por exemplo, Tableau Desktop ou Server instalado em uma instância do EC2 ou usando o Tableau Cloud).
- O suporte de bucket entre regiões funciona, mas o desempenho será pior do que o acesso à mesma região. Pode haver custo adicional devido às taxas de saída de dados.
Fazer a conexão e configurar a fonte de dados
- Inicie o Tableau e, em Conectar, selecione Amazon S3 na lista de Conectores adicionais.
- Selecione Instalar e reiniciar o Tableau para instalar o conector.
- Após a reinicialização do Tableau, acesse Conectare selecione Amazon S3 na lista de conectores instalados.
- Insira a região do bucket, o nome do bucket, a ID da chave de acesso e a chave de acesso secreta.
- Selecione Fazer logon.
- No conteúdo do seu bucket, selecione um arquivo ao qual deseja se conectar.
- Selecione Conectar.
Configurar a fontes de dados
Conclua as etapas a seguir para configurar a fonte de dados.
- (Opcional) Selecione o nome da fonte de dados padrão na parte superior da página.
- Insira um nome de fonte de dados exclusivo para uso no Tableau.
- Arraste um ou mais arquivos aos quais deseja se conectar do painel esquerdo para o canvas.
- Para iniciar sua análise, selecione a guia Planilha 1.
Unir linhas de dados
Você pode unir linhas de arquivos no seu bucket S3. Para obter mais informações sobre a união de linhas, consulte Unir linhas de dados. Para realizar uma união de linhas curinga que inclua arquivos em subpastas, a pasta raiz ou o bucket deve ter pelo menos um arquivo, que corresponda à estrutura dos arquivos contidos em subpastas, para incluir na união de linhas. Esse é o primeiro arquivo ao qual você se conecta ao criar a união de linhas.
Problemas conhecidos e limitações
As seções a seguir têm problemas conhecidos são que podem afetar o seu sucesso ao usar o conector Amazon S3.
Observação: esse conector não é compatível com a Criação na Web do Tableau Prep ou com conexões virtuais.
Problemas conhecidos e limitações da autenticação
Somente a autenticação de chave secreta/chave de acesso do usuário do Amazon IAM sem token de sessão é compatível.
Publicar problemas conhecidos e limitações
Pastas de trabalho e fontes de dados devem ser publicadas usando a opção de autenticação 'Senha inserida'. 'Avisar usuário' não é compatível no momento.
Problemas conhecidos e limitações da união de linhas
- Somente o Tableau Desktop é compatível com uma união de linhas curinga.
- A Criação na Web oferece suporte apenas à união de linhas manual definida pelo usuário (arrastar arquivos).
Problemas conhecidos e limitações do tipo de arquivo
- Arquivos Parquet, .csv, .gz compactados e do Excel são compatíveis no momento.
- Todos os dados são, por design, importados em formato de cadeia de caracteres.
- Você não pode unir linhas ou unir colunas em vários tipos de arquivo em uma única conexão (por exemplo, Parquet e .csv juntos).
- Atualmente, apenas arquivos .csv delimitados por vírgulas são compatíveis.
- O limite de tamanho do arquivo é 15 GB.
- O conjunto de resultados cumulativos de uma união de colunas ou união de linhas não pode exceder 15 GB.
- Atualmente, os arquivos do Excel não podem exceder ~100 mb devido a problemas de desempenho com o analisador de arquivos do Excel no conector.
Problemas conhecidos e limitações adicionais do arquivo Parquet
- Os arquivos Parquet devem estar no formato descrito em nossa Documentação da API do Hyper.
- Colunas aninhadas e, portanto, os tipos aninhados MAP e LIST não são compatíveis.
- Os tipos BSON, UUID e ENUM não são compatíveis.
- O tipo físico FIXED_LEN_BYTE_ARRAY sem qualquer tipo lógico ou convertido não é compatível.
- O tipo DECIMAL só é compatível até 8 bytes (18 dígitos decimais). Considere usar o dobro se precisar de mais de 18 dígitos decimais.
- Os tipos TIME_MILLIS e TIME_NANOS não são compatíveis. Considere usar TIME_MICROS em vez disso.
- A codificação obsoleta BIT_PACKED não é compatível. Nenhum arquivo Parquet recente deve usar essa codificação, pois ela está obsoleta há mais de meia década.
- A codificação DELTA_LENGTH_BYTE_ARRAY e a recente codificação BYTE_STREAM_SPLIT não são compatíveis, pois não são escritas por nenhuma biblioteca. Se você encontrar um arquivo Parquet usando essas codificações, informe-nos.
- As compactações compatíveis são SNAPPY, GZIP, ZSTD e LZ4_RAW.
Consulte também
- Configurar fontes de dados – Adicione mais dados a esta fonte de dados ou prepare os dados antes de analisá-los.
- Criar gráficos e analisar dados – Inicie a análise de dados.
- Otimização do Amazon Redshift e implantação do Tableau Software para obter um melhor desempenho(O link abre em nova janela) - whitepaper do Tableau (é necessário registro ou logon)
- Explore as análises de Big Data com o Amazon Redshift(O link abre em nova janela) - webinar sob demanda do Tableau (é necessário fazer o registro ou logon)