Mejorar el rendimiento en uniones entre bases de datos

Importante: Esta función mueve temporalmente los datos fuera de Tableau. Asegúrese de que la base de datos a la que está conectado procede de una fuente de confianza.

Al unir datos entre una única base de datos y un único archivo, Tableau puede mejorar el rendimiento al elegir realizar la unión utilizando la base de datos en lugar de Hyper. Esta configuración predeterminada permite a Tableau elegir el enfoque más rápido (Hyper o la base de datos conectada). Si Tableau utiliza la base de datos conectada, los datos de la conexión de archivos se mueven a tablas temporales de la base de datos y la unión se realiza ahí.

Condiciones de funcionalidad

La opción de utilizar la base de datos conectada para la unión solo está disponible si se cumplen las siguientes condiciones:

  • La fuente de datos consta de una o más conexiones basadas en archivos y una única conexión basada en SQL.
  • Los archivos a unir deben ser uno de los siguientes tipos de archivos: Microsoft Excel, PDF o Texto (.csv, .txt, .tsv o .tab).
  • La base de datos es de uno de estos tipos:
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • Vertica
    • Teradata
  • En creación web: la opción Permitir a los usuarios usar creación web está habilitada.

Cambiar la opción preferida en uniones entre bases de datos

  1. Conéctese a la primera fuente de datos.
    • En Tableau Desktop: en la página de inicio, en Conectar, conéctese a un tipo de archivo o de base de datos compatible. Con este paso se crea la primera conexión en la fuente de datos de Tableau.
    • En creación web: en las páginas Inicio o Explorar, haga clic en Crear > Libro de trabajo para iniciar un nuevo libro de trabajo y, a continuación, conéctese a sus datos. Con este paso se crea la primera conexión en la fuente de datos de Tableau.
  2. Seleccione el archivo o base de datos al que se quiere conectar y haga doble clic o arrastre una tabla al lienzo.

  3. En el panel izquierdo, en Conexiones, haga clic en el botón Añadir ( en creación web) para añadir la segunda conexión a la fuente de datos de Tableau.

    Se muestra la opción Unión entre bases de datos.

    Nota: Si no ve esta opción, compruebe que utiliza únicamente tipos de fuentes de datos compatibles y que tiene al menos dos fuentes de datos (una base de datos y uno o más archivos de los tipos compatibles).

  4. Para cambiar la forma en que Tableau realiza la unión, junto a la opción de Unión entre bases de datos, haga clic en Editar.
  5. En el cuadro de diálogo Unión entre bases de datos, seleccione una de las siguientes opciones y, a continuación, haga clic en Aceptar:
    • Realizar siempre uniones en la base de datos. Esta opción obliga a Tableau a utilizar la base de datos en tiempo real para realizar la unión.
    • Dejar que Tableau decida dónde unirse. Esta opción es la predeterminada y permite a Tableau elegir la opción más rápida para realizar la unión, ya sea Hyper o la base de datos a la que está conectado.

    La opción Unión entre bases de datos en el panel Conexiones múltiples se actualizará para reflejar su elección.

    Importante: Si selecciona Permitir a Tableau elegir dónde unir, Tableau elige la opción más rápida al realizar la unión. Este comportamiento está predeterminado por un conjunto de criterios que incluyen los tipos de unión. Por ejemplo, Tableau siempre elegirá Hyper para uniones no internas.

    Si Tableau utiliza Hyper para realizar la unión, este proceso ocurre en segundo plano y no se muestra ningún indicador que identifique dónde se realizó la unión.

  6. Añada una o varias cláusulas de unión seleccionando un campo de una fuente de datos, un operador de unión y un campo de la tabla añadida. Revise la cláusula de unión para asegurarse de que refleje la forma en la que desea conectar las tablas.

Acerca de trabajar con fuentes de datos multiconexión

El trabajo con fuentes de datos multiconexión es igual que con cualquier otra fuente de datos, con algunos aspectos a tener en cuenta que se describen en esta sección.

Unir datos de dentro de una conexión

Para unir datos, debe usar tablas de texto o de Excel de la misma conexión. Es decir, no puede unir tablas de diferentes bases de datos. En Tableau Desktop, puede unir tablas de diferentes archivos y libros de trabajo de Excel en directorios distintos. Para obtener más información, consulte Unir tablas mediante búsqueda con comodines (Tableau Desktop).

Si necesita unir datos de distintas bases de datos, utilice Tableau Prep(El enlace se abre en una ventana nueva).

Cotejo

Cotejo hace referencia a las reglas de una base de datos que determinan cómo se deben comparar y ordenar los valores de las cadenas. Habitualmente, el cotejo lo gestiona la base de datos. Sin embargo, cuando trabaja con combinaciones entre bases de datos, puede unir columnas que tengan diferentes cotejos.

Imagínese, por ejemplo, que su combinación entre bases de datos ha usado una clave de combinación formada por una columna de SQL Server que distingue entre mayúsculas y minúsculas y una columna de Oracle que no distingue entre mayúsculas y minúsculas. En este tipo de casos, Tableau asigna ciertos cotejos a otros para minimizar la posibilidad de que los valores se interpreten incorrectamente.

A continuación tiene las reglas que se usan en las combinaciones entre bases de datos:

  • Si una columna usa normas de cotejo del proyecto International Components for Unicode (ICU), Tableau usa el cotejo de la otra columna.
  • Si todas las columnas usan normas de cotejo del ICU, Tableau usa el cotejo de la columna de la tabla izquierda.
  • Si ninguna columna usa normas de cotejo del ICU, Tableau usa un cotejo binario. Un cotejo binario se refiere a que la configuración regional de la base de datos y el tipo de datos de las columnas determinan cómo se deben comparar y ordenar los valores de las cadenas.

Mantener la distinción entre mayúsculas y minúsculas para los datos de Excel

Si necesita mantener la distinción entre mayúsculas y minúsculas en los datos de Excel al realizar una unión, puede habilitar la opción Mantener mayúsculas y minúsculas (Excel) en el menú Datos.

Cuando esta opción está seleccionada, Tableau mantiene las mayúsculas y minúsculas e identifica de forma única los valores diferenciando entre mayúsculas y minúsculas en lugar de combinarlos, produciendo un número diferente de filas.

Por ejemplo, considere una hoja de cálculo con "Casa" y otra con "casa" y "CASA". De forma predeterminada, Tableau ignora las mayúsculas y minúsculas y considera las tres variaciones de "casa" como iguales. Con la opción Mantener mayúsculas y minúsculas (Excel) habilitada, cuando se unen las tablas, Tableau reconoce las diferencias de mayúsculas y minúsculas. "Casa", "casa" y "CASA" se tratan como valores diferentes.

Nota: Esta opción está disponible para todos los idiomas compatibles con Tableau y no depende de la configuración regional del sistema operativo. Esta opción solo está disponible para las fuentes de datos de Microsoft Excel.

Cálculos y fuentes de datos multiconexión

En una fuente de datos multiconexión solo se puede usar un subconjunto de cálculos.

  • En Tableau Desktop: puede usar un cálculo específico si cumple estas dos condiciones:
    • Se admite en todas las conexiones de la fuente de datos multiconexión.
    • Se admite en extracciones de Tableau.
  • En creación web (Tableau Cloud y Tableau Server): puede utilizar un cálculo específico si es compatible con todas las conexiones de la fuente de datos multiconexión.

Procedimientos almacenados

Los procedimientos almacenados no están disponibles para fuentes de datos multiconexión.

Pivotar datos de dentro de una conexión

Para pivotear datos, debe usar columnas de texto o de Excel de la misma conexión. Es decir, en un pivote no puede incluir columnas de diferentes bases de datos.

Definir los archivos de extracción como primera conexión (solo en Tableau Desktop)

Al conectarse a archivos de extracto en una fuente de datos multiconexión, asegúrese de que la conexión al archivo (.hyper) de extracto sea la primera conexión. De este modo se conserva cualquier personalización que pueda formar parte de la extracción, incluidos los cambios en las propiedades predeterminadas, los campos calculados, los grupos, los alias, etc.

Nota: Si necesita conectarse a varios archivos de extracción en una fuente de datos multiconexión, solo se conservan las personalizaciones de la extracción en la primera conexión.

Extracciones de fuentes de datos multiconexión que contienen conexiones a datos basados en archivos (solo en Tableau Desktop)

Si está publicando la extracción de una fuente de datos multiconexión con datos basados en un archivo, como Excel, seleccionar la opción Incluir archivos externos copia los datos basados en un archivo como parte de la fuente de datos. En este caso, se puede descargar una copia de los datos basados en un archivo y otros usuarios pueden acceder al contenido de dicha copia. Si los datos basados en un archivo contienen información confidencial que ha excluido intencionadamente de la extracción, no seleccione Incluir archivos externos cuando publique la fuente de datos.

Para obtener más información sobre la publicación de fuentes de datos, consulte Publicar una fuente de datos.

Acerca de las consultas y las combinaciones entre bases de datos

Para cada conexión, Tableau envía consultas independientes a las bases de datos en la unión. Los resultados se almacenan en una tabla temporal con el formato de un archivo de extracción.

Importante: Las uniones entre bases de datos pueden mover datos entre bases de datos. Asegúrese de que las bases de datos que está uniendo sean fuentes confiables.

Por ejemplo, suponga que crea conexiones a dos tablas, dbo.listings y reviews$. Estas tablas se almacenan en dos bases de datos diferentes, SQL Server y Excel. Tableau consulta a la base de datos en cada conexión de forma independiente. La base de datos realiza la consulta y aplica personalizaciones como filtros y cálculos y Tableau almacena los resultados para cada conexión en una tabla temporal. En este ejemplo, FQ_Temp_1 es la tabla temporal de la conexión a SQL Server y FQ_Temp_2 es la tabla temporal de la conexión a Excel.

Tabla de SQL Server

Tabla de Excel

Cuando realiza una combinación entre bases de datos, Tableau Desktop combina las tablas temporales. Tableau necesita estas tablas temporales para realizar combinaciones entre bases de datos.

Tras la combinación de las tablas se aplica el filtro Top N para limitar a las 1000 primeras filas el número de valores que se muestran en los datos en cuadrícula. Este filtro se aplica para ayudar a mantener la capacidad de respuesta de los datos en cuadrícula y el rendimiento general de la página Fuente de datos.

Tablas combinadas

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!