El modelo de datos de Tableau

Cada fuente de datos que se crea en Tableau tiene un modelo de datos. Puede pensar en un modelo de datos como un diagrama que indica a Tableau cómo debe consultar los datos en las tablas de bases de datos conectadas.

Las tablas que se añaden al lienzo en la página Fuente de datos crean la estructura de su modelo de datos. Un modelo de datos puede ser simple, como una sola tabla. También puede ser más complejo, con varias tablas que usan diferentes combinaciones de relaciones y uniones de filas y columnas.

El modelo de datos tiene dos capas:

  • La vista predeterminada que aparece al principio en el lienzo de la página de fuente de datos es la capa lógica de la fuente de datos. Puede combinar los datos en la capa lógica usando relaciones (o hilos). Piense en esta capa como el lienzo de relaciones en la página de fuente de datos. Para obtener más información, consulte Usar relaciones para el análisis de datos de varias tablas(El enlace se abre en una ventana nueva).
  • La siguiente capa es la capa física. Puede combinar los datos entre tablas en la capa física usando uniones de filas(El enlace se abre en una ventana nueva) o de columnas. Cada tabla lógica contiene al menos una tabla física en esta capa. Piense en la capa física como el lienzo de unión de filas o columnas en la página de fuente de datos. Haga doble clic en una tabla lógica para ver o agregar uniones de filas o columnas.

Capa lógica Capa física
Hilos = Relaciones Diagrama de Venn = Uniones de columnas
 
La vista de nivel superior de una fuente de datos con varias tablas relacionadas. Esta es la capa lógica. Las tablas lógicas se pueden combinar mediante relaciones (hilos). No usan tipos de unión de columnas. Actúan como contenedores para las tablas físicas. Haga doble clic en una tabla lógica para abrirla y ver sus tablas físicas. Las tablas físicas se pueden combinar usando uniones de filas o de columnas. En este ejemplo, la tabla lógica Libro se compone de tres tablas físicas unidas (Libro, Premio e Info).

 

Capa lógica Capa física
Lienzo de relaciones en la página de fuente de datos Lienzo de unión de filas o columnas en la página de fuente de datos
Las tablas que se arrastran aquí se denominan tablas lógicas Las tablas que se arrastran aquí se denominan tablas físicas
Las tablas lógicas se pueden relacionar con otras tablas lógicas Con las tabas físicas se pueden realizar uniones de columnas o de filas con otras tablas físicas
Las tablas lógicas son como contenedores para tablas físicas Haga doble clic en una tabla lógica para ver sus tablas físicas
El nivel de detalle está en el nivel de fila de la tabla lógica El nivel de detalle está en el nivel de fila de las tablas físicas fusionadas
Las tablas lógicas siguen siendo independientes (normalizadas), no fusionadas en la fuente de datos Las tablas físicas se fusionan en una sola tabla plana que define la tabla lógica

Capas del modelo de datos

La vista superior de una fuente de datos es la capa lógica del modelo de datos. También se puede conocer como el lienzo de relaciones, porque se combinan tablas usando relaciones en lugar de uniones de columnas.

Si se combinan datos de varias tablas, cada tabla que arrastre al lienzo en la capa lógica deberá tener una relación con otra tabla. No es necesario especificar los tipos de unión para las relaciones. Durante el análisis, Tableau selecciona las uniones adecuadas automáticamente según los campos y el contexto de análisis de una hoja de trabajo.

La capa física del modelo de datos es donde se pueden combinar los datos usando uniones de filas y columnas. Solo puede utilizar tablas dinámicas en este lienzo. Se podría considerar como el lienzo de unión de filas o columnas. En versiones anteriores de Tableau, la capa física era la única capa en el modelo de datos. Cada tabla lógica puede contener una o más tablas físicas.

Importante: Todavía puede crear fuentes de datos de tabla individual en Tableau que utilice uniones de filas y columnas. El comportamiento del análisis de tabla individual en Tableau no ha cambiado. Los libros de trabajo actualizados funcionarán igual que antes de la versión 2020.2.

Información sobre el modelo de datos

En versiones anteriores de Tableau (anteriores a 2020.2), el modelo de datos solo era tenía capa física. En Tableau 2020.2 y versiones posteriores, el modelo de datos tiene la capa lógica (semántica) y una capa física. Esto le ofrece más opciones para combinar datos mediante esquemas que se ajusten al análisis.

En Tableau 2020.2 y versiones posteriores, se ha añadido una capa lógica por encima de la capa física en la fuente de datos. Cada tabla lógica contiene tablas físicas en una capa física.

En versiones anteriores de Tableau (antes de la 2020.2), el modelo de datos de la fuente de datos consistía en una sola capa física donde se podían especificar uniones de filas y columnas. Las tablas añadidas a la capa física (con unión de filas o columnas) crean una única tabla plana (no normalizada) para el análisis.

Versiones anteriores 2020.2 y posteriores
 
En versiones de Tableau 2020.2, el modelo de datos solo tenía la capa física En la versión 2020.2 y versiones posteriores, el modelo de datos tiene dos capas: la capa lógica y la capa física

En Tableau 2020.2 y posteriores, el modelo de datos de la fuente de datos ahora incluye una nueva capa semántica sobre la capa física (llamada capa lógica) en la que puede añadir varias tablas y relacionarlas entre sí. Las tablas de la capa lógica no se fusionan en la fuente de datos, siguen siendo independientes (normalizadas) y mantienen su nivel de detalle nativo.

Actúan como contenedores para las tablas físicas fusionadas. Una tabla lógica puede contener una sola tabla física. También puede contener varias tablas físicas combinadas a través de uniones de filas o de columnas.

Construir un nuevo modelo

Al agregar una o más tablas a la capa lógica, se está creando el modelo de datos para la fuente de datos. Una fuente de datos puede estar compuesta por una sola tabla lógica o, también, puede arrastrar varias tablas al lienzo para crear un modelo más complejo.

  • La primera tabla que arrastre al lienzo se convierte en la tabla raíz del modelo de datos en la fuente de datos.
  • Después de arrastrar la tabla raíz, puede arrastrar tablas adicionales en cualquier orden. Deberá tener en cuenta qué tablas deben estar relacionadas entre sí y los pares de campos coincidentes que defina para cada relación.
  • Si va a crear un esquema de estrella, puede ser útil arrastrar primero la tabla de hechos y, a continuación, relacionar las tablas de dimensiones con esa tabla.
  • Al eliminar una tabla en el lienzo, también se eliminan automáticamente sus descendientes relacionados. Si elimina la tabla raíz, también se eliminan todas las demás tablas del modelo.
  • Cada relación debe estar formada por, al menos, un par de campos coincidentes. Añada varios pares de campos para crear una relación compuesta. Los pares de campos deben tener el mismo tipo de datos. Cambiar el tipo de datos en la página de fuente de datos no cambia este requisito. Tableau seguirá utilizando el tipo de datos de la base de datos subyacente para las consultas.
  • Las relaciones pueden formarse en función de los campos calculados.
  • Puede especificar cómo se deben comparar los campos utilizados en las relaciones mediante operadores al definir la relación.

Para obtener más información acerca de las relaciones, consulte Crear y definir relaciones en Relacione sus datos.

Modelos multitabla

  • Para crear un modelo de varias tablas, arrastre las tablas a la capa lógica del lienzo de la página de fuente de datos.


Las tablas que se arrastran a la capa lógica del lienzo de la página de fuente de datos deben estar relacionadas entre sí. Al arrastrar tablas adicionales al lienzo de capa lógica, Tableau intenta crear automáticamente la relación en función de las restricciones clave existentes y los campos coincidentes para definir la relación. Si no puede determinar los campos coincidentes, deberá seleccionarlos.

Si no se detecta ninguna restricción, se crea una relación de varios a varios y la integridad referencial se establece en Algunos registros coinciden. Esta configuración predeterminada es una opción segura y proporciona la mayor flexibilidad para la fuente de datos. La configuración predeterminada admite uniones externas completas de columnas y optimiza las consultas agregando datos de tabla antes de formar uniones de columnas durante el análisis. Todos los datos de las columnas y filas de cada tabla se pueden analizar.

Puede agregar más datos dentro de cualquier tabla lógica haciendo doble clic en la tabla. Esto abre la capa física del lienzo de la página de fuente de datos. Si necesita utilizar uniones de filas o columnas, puede arrastrar las tablas en las que quiera hacerlo al lienzo de la capa física. Las tablas físicas se combinan en su tabla lógica.

Siga los pasos descritos en Crear y definir relaciones para combinar varias tablas.

Modelos de tabla individual

  • Para crear un modelo de tabla individual, arrastre una tabla al lienzo de capa lógica de la página de fuente de datos. A continuación, puede usar los campos de esa tabla en el panel Datos para el análisis.

Modelo de tabla individual que contiene otras tablas

Puede agregar más datos dentro de la única tabla lógica haciendo doble clic en la tabla. Esto abre la capa física del lienzo de la página de fuente de datos. Si necesita utilizar uniones de filas o columnas, puede arrastrar las tablas en las que quiera hacerlo al lienzo de la capa física. Las tablas físicas se combinan en su tabla lógica.

En este ejemplo se muestra la tabla Libro en el lienzo Relaciones (capa lógica) de la fuente de datos. Al hacer doble clic en la tabla lógica Libro, se abre el lienzo Unión de filas/Unión de columnas (capa física).

En este ejemplo, las combinaciones fusionan las tablas Premio e Info con la tabla Libro. En este caso, la unión entre Libro y Premio será de uno a varios, a nivel de detalle de los premios. Esto duplicaría los valores de medida para Libro e Info. Para evitar la duplicación, puede relacionar Premio e Info con Libro en lugar de unirlos dentro de la tabla lógica Libro.

Esquemas de modelos de datos admitidos

Las funcionalidades de modelado de datos de Tableau 2020.2 y posteriores están diseñadas para simplificar el análisis sobre escenarios de datos comunes de varias tablas, incluidos los modelos de datos de estrellas y copo de nieve. Los siguientes tipos de modelos son compatibles con las fuentes de datos de Tableau.

Tabla individual

El análisis en una sola tabla lógica que contiene una mezcla de dimensiones y medidas funciona igual que en versiones anteriores a Tableau 2020.2. Puede crear una tabla lógica mediante una combinación de uniones de filas, de columnas, SQL personalizado, etc..

Estrella y copo de nieve

En los almacenes de datos empresariales, es común tener datos estructurados en "estrella" o "esquemas de copo de nieve" donde las medidas están contenidas en una tabla de hechos central y las dimensiones se almacenan por separado en tablas de dimensiones independientes. Esta organización de datos admite muchos flujos de análisis comunes, incluidos el resumen y la obtención de detalles.

Estos modelos se pueden representar directamente con relaciones en las funcionalidades de modelado de datos disponibles a partir de Tableau 2020.2.

Arrastre primero la tabla de hechos al modelo y, a continuación, relacione las tablas de dimensiones con la tabla de hechos (en un esquema de estrella) o a otras tablas de dimensiones (en un copo de nieve).

Normalmente, en un esquema de estrella o copo de nieve bien modelado, las relaciones entre la tabla de hechos y las tablas de dimensiones serán de varios a uno. Si esta información está codificada en el almacén de datos, Tableau la usará automáticamente para establecer las opciones de rendimiento de la relación. Si no es así, puede establecer esta información usted mismo. Para obtener más información, consulte Optimizar consultas de relación usando las opciones de rendimiento.

En un esquema de estrella o copo de nieve bien modelado, cada fila de la tabla de hechos tendrá una entrada coincidente en cada una de las tablas de dimensiones. Si esto es cierto y se captura en las restricciones de integridad del almacén de datos, Tableau utilizará automáticamente esta información para establecer la configuración de integridad referencial en Opciones de rendimiento. Si algunas filas de tabla de hechos no tienen una fila coincidente en una tabla de dimensiones (a veces denominadas "dimensiones de llegada tardía" o "hechos de llegada temprana"), Tableau conservará de forma predeterminada todas las filas al calcular medidas, pero puede quitar valores al mostrar encabezados de dimensión. Para obtener más información, consulte Optimizar consultas de relación usando las opciones de rendimiento.

Estrella y copo de nieve con medidas en más de una tabla

En algunos esquemas de estrellas o copo de nieve, todas las medidas para su análisis se incluyen en la tabla de hechos. Sin embargo, a menudo es cierto que pueden estar relacionadas medidas adicionales de interés con las tablas de dimensiones del análisis. Incluso si las tablas de dimensiones no contienen medidas, es común en el análisis querer contar o agregar valores de dimensión. En estos casos, la distinción entre tablas de hechos y tablas de dimensiones es menos clara. Para obtener esa claridad al ver el modelo de datos, se recomienda agregar primero la tabla de grano más fina al lienzo de la fuente de datos y, a continuación, relacionar todas las demás tablas con esa primera tabla.

Si se unieran estas tablas en una única tabla lógica, las medidas de las tablas de dimensiones se replicarían, lo que daría lugar a agregados distorsionados a menos que tomara precauciones para deduplicar los valores mediante cálculos LOD o COUNT DISTINCT. Sin embargo, si en su lugar crea relaciones entre estas tablas, Tableau agregará medidas antes de realizar combinaciones, evitando el problema de duplicación innecesaria. Esto le libera de la necesidad de realizar un seguimiento cuidadoso del nivel de detalle de sus medidas.

Análisis multivariante

En la versión 2024.2 y posteriores, las capacidades de modelado de datos de Tableau admiten el análisis multivariante mediante el uso de relaciones multifactor. Para obtener información detallada sobre cómo crear modelos de datos de relaciones multifactor, consulte:

Un modelo de relación multivariante (un modelo de datos con varias tablas base) permite usar tablas no relacionadas en el modelo cuando también existen tablas compartidas en el modelo. Durante el análisis, los campos de una tabla compartida "anexan" tablas de datos que de otro modo no estarían relacionadas en función de las dimensiones compartidas que tienen en común (como que suceden en el mismo lugar o al mismo tiempo). Se mantienen todos los beneficios de las relaciones, incluida la retención del grano de cada tabla o nivel nativo de detalle.

De manera similar a un modelo de datos de tabla base única, Tableau determina el mejor tipo de combinación para usar en segundo plano según la estructura de la visualización. Pero en un modelo de relación multifactor, las opciones de unión se amplían para incluir uniones externas y cruzadas para manejar diferentes niveles de relación. Para obtener más información, consulte Acerca de los modelos de datos de relaciones multifactor(El enlace se abre en una ventana nueva).

Nota: En las versiones 2020.2 a 2024.1, puede agregar tablas de hechos (que contengan medidas) a los modelos de estrellas y copos de nieve solo si están relacionados con una tabla de una sola dimensión.

Esto se puede utilizar, por ejemplo, para reunir dos o más tablas de hechos y analizar una dimensión compartida, como en los análisis Customer 360. Estas tablas de hechos pueden tener un nivel de detalle diferente al de la tabla de dimensiones o entre sí. También pueden tener una relación de varios a varios con la tabla de dimensiones. En estos casos, Tableau se encargará de que los valores no se dupliquen antes de la agregación.

Si no tiene una tabla de dimensiones compartida que relacione las tablas de hechos, a veces puede crear dinámicamente una mediante SQL personalizado o mediante uniones de filas o de columnas de otras tablas de dimensiones.

Dos tablas de hechos se pueden relacionar directamente entre sí en una dimensión común. Este tipo de análisis funciona mejor cuando una de las tablas de hechos contiene un superconjunto de la dimensión común.

Hay varios escenarios que pueden indicar que se debe crear un modelo de relación multifactor con varias tablas base en lugar de una única fuente de datos de tabla base:

  • Relaciones circulares. No se admiten relaciones circulares. Si está intentando crear una fuente de datos con un ciclo, utilice relaciones multifactor y convierta la tabla descendente en otra tabla base.
  • Dimensiones conformadas y Relaciones OR contextuales. Si tiene una serie de tablas que están relacionadas en los mismos conjuntos de cláusulas de relación (como fecha y ubicación), esas dimensiones deben extraerse y convertirse en tablas compartidas.
    • Esto es especialmente útil porque varias cláusulas de relación deben ser todas verdaderas (lógicamente, un AND) para que las tablas estén relacionadas para esos registros.
    • Si, en cambio, desea analizar registros donde uno puede ser verdadero a la vez (un OR contextual), esta flexibilidad se proporciona configurando un modelo de datos con tablas de dimensiones compartidas.
  • Combinaciones equivalentes. Si está utilizando una combinación pero desea tener una combinación equivalente sin fuentes de datos principales y secundarias, cree un modelo de datos que combine las fuentes de datos de la combinación con sus campos de enlace en una tabla o tablas compartidas.

Requisitos para las relaciones en un modelo de datos

  • Al relacionar las tablas, los campos que definan las relaciones deben tener el mismo tipo de datos. Cambiar el tipo de datos en la página de fuente de datos no cambia este requisito. Tableau seguirá utilizando el tipo de datos de la base de datos subyacente para las consultas.
  • No puede definir relaciones basadas en campos geográficos.
  • Las relaciones circulares no se admiten en el modelo de datos.
  • No puede definir relaciones entre fuentes de datos publicadas.

Factores que limitan las ventajas del uso de tablas relacionadas

  • Los datos sucios de las tablas (es decir, tablas que no se crearon teniendo en cuenta un modelo bien estructurado y que contienen una combinación de medidas y dimensiones en varias tablas) pueden hacer que el análisis de varias tablas sea más complejo.
  • El uso de filtros de fuentes de datos limitará la capacidad de Tableau para realizar la separación de uniones en los datos. "Separación de uniones" es un término que explica la forma en que Tableau simplifica las consultas mediante la eliminación de uniones innecesarias.
  • Tablas con una gran cantidad de valores no coincidentes entre relaciones.
  • En las versiones 2020.2 hasta la 2024.1: Relación de varias tablas de hechos con varias tablas de dimensiones (intentando modelar dimensiones compartidas o compatibles). En la versión 2024.2 y posteriores, puede utilizar relaciones multifactor para abordar estos casos.
¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!