Mejorar el rendimiento en uniones entre bases de datos

Importante: Esta función mueve temporalmente los datos fuera de Tableau. Asegúrese de que la base de datos a la que está conectado procede de una fuente de confianza.

A partir de la versión 2019.3 de Tableau Desktop y Tableau Server, puede mejorar el rendimiento de la unión de datos de una única conexión de archivo y una única conexión de base de datos permitiendo que Tableau realice la unión no en Hyper, sino empleando la base de datos a la que está conectado. Cuando esta opción está habilitada, Tableau elige la opción más rápida (Hyper o la base de datos conectada). Si Tableau utiliza la base de datos conectada, los datos de la conexión de archivos se mueven a tablas temporales de la base de datos y la unión se realiza ahí.

Condiciones de funcionalidad

Esta opción solo está disponible si se cumplen las siguientes condiciones:

  • La fuente de datos consta de una o más conexiones basadas en archivos y una única conexión basada en SQL.
  • El archivo es de tipo Microsoft Excel, PDF o texto (.csv, .txt, .tsv o .tab).
  • La base de datos es de uno de estos tipos:
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • Vertica
    • Teradata
  • El tipo de unión es una unión interna.
  • En creación web: la opción Permitir a los usuarios usar creación web está habilitada.

    Los administradores de sitio también pueden configurar las opciones disponibles para los usuarios estableciendo las opciones de Unión entre bases de datos en la pestaña Configuración > General de Tableau Server. Para obtener más información sobre estos ajustes, consulte Establecer el acceso de creación web de un sitio(El enlace se abre en una ventana nueva) en la ayuda de Tableau Server.

Anular las condiciones de la funcionalidad

A partir de la versión 2020.3, como administrador, puede anular el tamaño del archivo, el tipo de unión y las limitaciones de conexión de un solo archivo y forzar a Tableau a utilizar la conexión de base de datos en tiempo real para realizar la unión. Esto le permite experimentar y determinar las configuraciones de rendimiento óptimas. Se sigue aplicando el requisito de conexión de base de datos única.

Para habilitar esta opción, introduzca la siguiente información de la línea de comandos:

  • Tableau Desktop: introduzca el comando tableau.exe -DForceAlternativeFederationEngine=true.
  • Tableau Server: introduzca el comando tsm configuration tsm configuration set -k native_api.force_alternative_federation_engine -v true

    Para obtener más información sobre configurar valores de ajuste en Tableau Server, consulte Opciones de tsm configuration set(El enlace se abre en una ventana nueva) en la ayuda de Tableau Server.

Habilitar la opción de rendimiento en uniones entre bases de datos

  1. En Tableau Desktop: en la página de inicio, en Conectar, conéctese a un tipo de archivo o de base de datos compatible. Con este paso se crea la primera conexión en la fuente de datos de Tableau.

    En creación web: en las páginas Inicio o Explorar, haga clic en Crear > Libro de trabajo para iniciar un nuevo libro de trabajo y, a continuación, conéctese a sus datos. Con este paso se crea la primera conexión en la fuente de datos de Tableau.

  2. Seleccione el archivo o base de datos al que se quiere conectar y haga doble clic o arrastre una tabla al lienzo.

  3. En el panel izquierdo, en Conexiones, haga clic en el botón Añadir ( en creación web) para añadir la segunda conexión a la fuente de datos de Tableau.

    Se muestra la opción Unión entre bases de datos.

    Nota: Si no ve esta opción, compruebe que utiliza únicamente fuentes de datos compatibles y que solo tiene dos fuentes de datos (un archivo y un tipo de base de datos). De lo contrario, es posible que el administrador de sitio haya establecido la opción de configuración Unión entre bases de datos en Solo Tableau.

  4. Para cambiar la forma en que Tableau realiza la unión, junto a la opción de Unión entre bases de datos, haga clic en Editar.
  5. En el cuadro de diálogo Unión entre bases de datos, seleccione una de las siguientes opciones y, a continuación, haga clic en Aceptar:

    • Usar Tableau o bases de datos existentes. Esta opción permite a Tableau elegir la opción más rápida para realizar la unión, ya sea Hyper o la base de datos a la que está conectado.

    • Usar solo Tableau. Esta opción es la predeterminada y siempre utiliza Hyper para realizar la unión.

      La opción Unión entre bases de datos cambia de la opción predeterminada, Usando Tableau (usando Hyper), a la nueva opción Usando su base de datos, dependiendo de lo que elija.

      Importante: Si selecciona Usar Tableau o bases de datos existentes, Tableau elige la opción más rápida al realizar la unión. Este comportamiento está predeterminado por un conjunto de criterios que incluyen los tipos de unión. Por ejemplo, Tableau siempre elegirá Hyper para uniones no internas.

      Si Tableau utiliza Hyper para realizar la unión, este proceso ocurre en segundo plano y no se muestra ningún indicador que identifique dónde se realizó la unión.

  6. Añada una o varias cláusulas de unión seleccionando un campo de una de las tablas disponibles usadas en la fuente de datos, un operador de unión y un campo de la tabla añadida. Revise la cláusula de unión para asegurarse de que refleje la forma en la que desea conectar las tablas.

Acerca de trabajar con fuentes de datos multiconexión

El trabajo con fuentes de datos multiconexión es igual que con cualquier otra fuente de datos, con algunos aspectos a tener en cuenta que se describen en esta sección.

Unir datos de dentro de una conexión

Para unir datos, debe usar tablas de texto o de Excel de la misma conexión. Es decir, no puede unir tablas de diferentes bases de datos. En Tableau Desktop, puede unir tablas de diferentes archivos y libros de trabajo de Excel en carpetas distintas. Para obtener más información, consulte Unir tablas mediante búsqueda con comodines (Tableau Desktop).

Si necesita unir datos de distintas bases de datos, utilice Tableau Prep(El enlace se abre en una ventana nueva).

Cotejo

Cotejo hace referencia a las reglas de una base de datos que determinan cómo se deben comparar y ordenar los valores de las cadenas. En la mayoría de casos, el cotejo lo gestiona la base de datos. Sin embargo, cuando trabaja con combinaciones entre bases de datos, puede unir columnas que tengan diferentes cotejos.

Imagínese, por ejemplo, que su combinación entre bases de datos ha usado una clave de combinación formada por una columna de SQL Server que distingue entre mayúsculas y minúsculas y una columna de Oracle que no distingue entre mayúsculas y minúsculas. En este tipo de casos, Tableau asigna ciertos cotejos a otros para minimizar la posibilidad de que los valores se interpreten incorrectamente.

A continuación tiene las reglas que se usan en las combinaciones entre bases de datos:

  • Si una columna usa normas de cotejo del proyecto International Components for Unicode (ICU), Tableau usa el cotejo de la otra columna.

  • Si todas las columnas usan normas de cotejo del ICU, Tableau usa el cotejo de la columna de la tabla izquierda.

  • Si ninguna columna usa normas de cotejo del ICU, Tableau usa un cotejo binario. Un cotejo binario se refiere a que la configuración regional de la base de datos y el tipo de datos de las columnas determinan cómo se deben comparar y ordenar los valores de las cadenas.

Al trabajar con datos de Microsoft Excel, si necesita mantener la distinción entre mayúsculas y minúsculas en los datos al realizar uniones (por ejemplo, datos en japonés que distinguen kana), puede habilitar la opción Mantener mayúsculas y minúsculas (Excel) en el menú Datos.

Cuando se selecciona esta opción, Tableau mantiene el uso de mayúsculas y minúsculas de los valores de la fuente de datos de Excel, e identifica de forma exclusiva valores con diferente uso de mayúsculas y minúsculas en lugar de combinarlos, lo que produce un número diferente de filas.

Por ejemplo, tiene una hoja de cálculo con el valor "Casa" y otra hoja con los valores "Casa", "casa" y "caSa". De forma predeterminada, cuando se unen las dos tablas, Tableau ignora las diferencias de mayúsculas y minúsculas en la segunda hoja de cálculo, y une "Casa", "casa" y "caSa" de la segunda hoja de cálculo con "Casa" de la primera.

Con la opción Mantener mayúsculas y minúsculas (Excel) habilitada, cuando se unen las tablas, Tableau reconoce las diferencias de mayúsculas y minúsculas. Los resultados de la unión muestran menos resultados, porque la unión solo relacionará "Casa" de la primera hoja de cálculo con el valor "Casa" de la segunda, y reconocerá "casa" y "caSa" como valores independientes únicos.

Nota: Esta opción está disponible para todos los idiomas compatibles con Tableau y no depende de la configuración regional del sistema operativo. Esta opción solo está disponible para las fuentes de datos de Microsoft Excel.

Cálculos y fuentes de datos multiconexión

En una fuente de datos multiconexión solo se puede usar un subconjunto de cálculos.

En Tableau Desktop: puede usar un cálculo específico si cumple estas dos condiciones:

  • Se admite en todas las conexiones de la fuente de datos multiconexión.

  • Se admite en extracciones de Tableau.

En creación web (Tableau Online y Tableau Server): puede utilizar un cálculo específico si es compatible con todas las conexiones de la fuente de datos multiconexión.

Procedimientos almacenados

Los procedimientos almacenados no están disponibles para fuentes de datos multiconexión.

Pivotar datos de dentro de una conexión

Para pivotear datos, debe usar columnas de texto o de Excel de la misma conexión. Es decir, en un pivote no puede incluir columnas de diferentes bases de datos.

Definir los archivos de extracción como primera conexión (solo en Tableau Desktop)

Al conectarse a archivos de extracción en una fuente de datos con varias conexiones, asegúrese de que la conexión al archivo (.tde o .hyper) de extracción sea la primera conexión. De este modo se conserva cualquier personalización que pueda formar parte de la extracción, incluidos los cambios en las propiedades predeterminadas, los campos calculados, los grupos, los alias, etc.

Nota: si necesita conectarse a varios archivos de extracción en una fuente de datos multiconexión, solo se conservan las personalizaciones de la extracción en la primera conexión.

Extracciones de fuentes de datos multiconexión que contienen conexiones a datos basados en archivos (solo en Tableau Desktop)

Si está publicando la extracción de una fuente de datos multiconexión que contiene una conexión a datos basados en un archivo, como Excel, seleccionar la opción Incluir archivos externos coloca en el servidor una copia de los datos basados en un archivo como parte de la fuente de datos. En este caso, se puede descargar una copia de los datos basados en un archivo y otros usuarios pueden acceder al contenido de dicha copia. Si los datos basados en un archivo contienen información confidencial que ha excluido intencionadamente de la extracción, no seleccione Incluir archivos externos cuando publique la fuente de datos.

Para obtener más información sobre la publicación de fuentes de datos, consulte Publicar una fuente de datos.

Acerca de las consultas y las combinaciones entre bases de datos

Para cada conexión, Tableau envía consultas independientes a las bases de datos en la unión. Los resultados se almacenan en una tabla temporal con el formato de un archivo de extracción.

Por ejemplo, suponga que crea conexiones a dos tablas, dbo.listings y reviews$. Estas tablas se almacenan en dos bases de datos diferentes, SQL Server y Excel. Tableau consulta a la base de datos en cada conexión de forma independiente. La base de datos realiza la consulta y aplica personalizaciones como filtros y cálculos y Tableau almacena los resultados para cada conexión en una tabla temporal. En este ejemplo, FQ_Temp_1 es la tabla temporal de la conexión a SQL Server y FQ_Temp_2 es la tabla temporal de la conexión a Excel.

Tabla de SQL Server

Tabla de Excel

Cuando realiza una combinación entre bases de datos, Tableau Desktop combina las tablas temporales. Tableau necesita estas tablas temporales para realizar combinaciones entre bases de datos.

Tras la combinación de las tablas se aplica el filtro "topn" para limitar a las 1000 primeras filas el número de valores que se muestran en los datos en cuadrícula. Este filtro se aplica para ayudar a mantener la capacidad de respuesta de los datos en cuadrícula y el rendimiento general de la página Fuente de datos.

Tablas combinadas

¡Gracias por sus comentarios!