Amazon S3
En este artículo se describe cómo conectar Tableau al conector sin controlador de Amazon S3 y cómo configurar la fuente de datos.
Antes de empezar, recopile esta información de conexión:
La región de AWS de su depósito S3.
El nombre del depósito S3.
Su clave de acceso de AWS IAM para su depósito S3 (ID de clave y clave de acceso secreta).
Permisos
Asegúrese de que su usuario de AWS IAM tenga permisos de lectura para su depósito S3.
Recomendaciones
Las siguientes recomendaciones pueden ayudar a aumentar el rendimiento.
- Se logra un rendimiento óptimo si el cliente se ejecuta en un entorno de AWS (por ejemplo, Tableau Desktop o Server instalado en una instancia EC2 o utilizando Tableau Cloud).
- La compatibilidad con depósitos entre regiones funciona, pero el rendimiento será peor que el acceso a la misma región. Puede haber un costo adicional debido a las tarifas de salida de datos.
Establecer la conexión y configurar la fuente de datos
- Inicie Tableau y, en Conectar, seleccione Amazon S3 de la lista de Conectores adicionales.
- Seleccione Instalar y reiniciar Tableau para instalar el conector.
- Después de reiniciar Tableau, vaya a Conectar y seleccione Amazon S3 de la lista de conectores instalados.
- Escriba su Región de depósito, Nombre de depósito, ID de clave de acceso y Clave de acceso secreta.
- Seleccione Iniciar sesión.
- En el contenido de su depósito, seleccione un archivo al que desee conectarse.
- Seleccione Conectar.
Configurar la fuente de datos
Complete los siguientes pasos para configurar la fuente de datos.
- (Opcional) Seleccione el nombre de la fuente de datos predeterminada en la parte superior de la página.
- Escriba un nombre de fuente de datos único para usar en Tableau.
- Arrastra uno o más archivos a los que quiera conectarse desde el panel izquierdo al lienzo.
- Para comenzar su análisis, seleccione la pestaña Sheet 1.
Unir filas de datos
Puede unir archivos desde su cubo S3. Para obtener más información sobre las uniones, consulte Unir los datos. Para realizar una unión de carácter comodín que incluya archivos en subcarpetas, la carpeta raíz o el depósito debe tener al menos un archivo, que coincida con la estructura de los archivos contenidos en las subcarpetas, para incluirlo en la unión. Este archivo es el primer archivo al que se conecta al crear la unión.
Limitaciones y problemas conocidos
Las siguientes secciones tienen problemas conocidos y limitaciones que pueden afectar su éxito al usar el conector de Amazon S3.
Nota: Este conector no es compatible actualmente con la creación web de Tableau Prep ni con las conexiones virtuales.
Problemas conocidos y limitaciones de autenticación
Solo se admite la autenticación de clave secreta o clave de acceso de usuario de Amazon IAM sin token de sesión.
Problemas conocidos y limitaciones de publicación
Los libros de trabajo y las fuentes de datos deben publicarse mediante la opción de autenticación "Contraseña integrada". "Preguntar al usuario" no se admite actualmente.
Problemas conocidos y limitaciones de unión
- Solo Tableau Desktop admite una unión de carácter comodín.
- La creación web solo admite la unión manual definida por el usuario (arrastrar archivos).
Problemas conocidos y limitaciones del tipo de archivo
- Los archivos Parquet,.csv, comprimidos .gz y Excel son compatibles en este momento.
- Todos los datos, por diseño, se importan en formato de cadena.
- No puede unir columnas ni filas de varios tipos de archivos en una sola conexión (por ejemplo, Parquet y CSV juntos).
- Actualmente solo se admiten archivos .csv delimitados por comas.
- El límite de tamaño del archivo es 15 GB.
- El conjunto de resultados acumulativos de una unión de filas o columnas no puede superar los 15 GB.
- Actualmente, los archivos de Excel no pueden superar los ~100 MB debido a problemas de rendimiento con el analizador de archivos de Excel en el conector.
Problemas conocidos y limitaciones adicionales del archivo Parquet
- Los archivos Parquet deben tener el formato descrito en nuestra Documentación de la API de Hyper.
- Las columnas anidadas y, por lo tanto, los tipos anidados MAP y LIST no son compatibles.
- Los tipos BSON, UUID y ENUM no son compatibles.
- No se admite el tipo físico FIXED_LEN_BYTE_ARRAY sin ningún tipo lógico o convertido.
- El tipo DECIMAL solo se admite hasta 8 bytes (18 dígitos decimales). Considere usar el doble si necesita más de 18 dígitos decimales.
- Los tipos TIME_MILLIS y TIME_NANOS no son compatibles. Considere usar TIME_MICROS en su lugar.
- La codificación obsoleta BIT_PACKED no es compatible. Ningún archivo Parquet reciente debe usar esta codificación, ya que está obsoleta desde hace más de media década.
- La codificación DELTA_LENGTH_BYTE_ARRAY y la codificación reciente BYTE_STREAM_SPLIT no son compatibles, ya que no están escritas por ninguna biblioteca. Si encuentra algún archivo Parquet que use estas codificaciones, háganoslo saber.
- Las compresiones admitidas son SNAPPY, GZIP, ZSTD y LZ4_RAW.
Consulte también
- Configurar fuentes de datos: añada más datos a esta fuente de datos o prepare sus datos antes de analizarlos.
- Crear gráficos y analizar datos: empiece su análisis de datos.
- Optimizar la implementación de Amazon Redshift y Tableau Software para lograr un mejor rendimiento (en inglés)(El enlace se abre en una ventana nueva) - Informe de Tableau (es necesario registrarse o iniciar sesión)
- Explore Big Data Analytics with Amazon Redshift(El enlace se abre en una ventana nueva) (Explorar análisis de big data con Amazon Redshift) - Seminario web a pedido de Tableau (es necesario registrarse o iniciar sesión)