El modelo de datos de Tableau

Cada fuente de datos que se crea en Tableau tiene un modelo de datos. Puede pensar en un modelo de datos como un diagrama que indica a Tableau cómo debe consultar los datos en las tablas de bases de datos conectadas.

Las tablas que se añaden al lienzo en la página Fuente de datos crean la estructura de su modelo de datos. Un modelo de datos puede ser simple, como una sola tabla. También puede ser más complejo, con varias tablas que usan diferentes combinaciones de relaciones y uniones de filas y columnas.

El modelo de datos tiene dos capas:

  • La vista predeterminada que aparece al principio en el lienzo de la página de fuente de datos es la capa lógica de la fuente de datos. Puede combinar los datos en la capa lógica usando relaciones (o hilos). Piense en esta capa como el lienzo de relaciones en la página de fuente de datos. Para obtener más información, consulte Usar relaciones para el análisis de datos de varias tablas.
  • La siguiente capa es la capa física. Puede combinar los datos entre tablas en la capa física usando uniones de filas o de columnas. Cada tabla lógica contiene al menos una tabla física en esta capa. Piense en la capa física como el lienzo de unión de filas o columnas en la página de fuente de datos. Haga doble clic en una tabla lógica para ver o agregar uniones de filas o columnas.

Capa lógica   Capa física
Hilos = Relaciones   Diagrama de Venn = Uniones de columnas
 
La vista de nivel superior de una fuente de datos con varias tablas relacionadas. Esta es la capa lógica. Las tablas lógicas se pueden combinar mediante relaciones (hilos). No usan tipos de unión de columnas. Actúan como contenedores para las tablas físicas.   Haga doble clic en una tabla lógica para abrirla y ver sus tablas físicas. Las tablas físicas se pueden combinar usando uniones de filas o de columnas. En este ejemplo, la tabla lógica Libro se compone de tres tablas físicas unidas (Libro, Premio e Info).

 

Capa lógica   Capa física
Lienzo de relaciones en la página de fuente de datos   Lienzo de unión de filas o columnas en la página de fuente de datos
Las tablas que se arrastran aquí se denominan tablas lógicas   Las tablas que se arrastran aquí se denominan tablas físicas
Las tablas lógicas se pueden relacionar con otras tablas lógicas   Con las tabas físicas se pueden realizar uniones de columnas o de filas con otras tablas físicas
Las tablas lógicas son como contenedores para tablas físicas   Haga doble clic en una tabla lógica para ver sus tablas físicas
El nivel de detalle está en el nivel de fila de la tabla lógica   El nivel de detalle está en el nivel de fila de las tablas físicas fusionadas
Las tablas lógicas siguen siendo independientes (normalizadas), no fusionadas en la fuente de datos   Las tablas físicas se fusionan en una sola tabla plana que define la tabla lógica

Capas del modelo de datos

La vista superior de una fuente de datos es la capa lógica del modelo de datos. También se puede conocer como el lienzo de relaciones, porque se combinan tablas usando relaciones en lugar de uniones de columnas.

Si se combinan datos de varias tablas, cada tabla que arrastre al lienzo en la capa lógica deberá tener una relación con otra tabla. No es necesario especificar los tipos de unión para las relaciones. Durante el análisis, Tableau selecciona las uniones adecuadas automáticamente según los campos y el contexto de análisis de una hoja de trabajo.

La capa física del modelo de datos es donde se pueden combinar los datos usando uniones de filas y columnas. Solo puede utilizar tablas dinámicas en este lienzo. Se podría considerar como el lienzo de unión de filas o columnas. En versiones anteriores de Tableau, la capa física era la única capa en el modelo de datos. Cada tabla lógica puede contener una o más tablas físicas.

Importante: Todavía puede crear fuentes de datos de tabla individual en Tableau que utilice uniones de filas y columnas. El comportamiento del análisis de tabla individual en Tableau no ha cambiado. Los libros de trabajo actualizados funcionarán igual que antes de la versión 2020.2.

Información sobre el modelo de datos

En versiones anteriores de Tableau, el modelo de datos solo tenía la capa física. En Tableau 2020.2 y versiones posteriores, el modelo de datos tiene la capa lógica (semántica) y una capa física. Esto le ofrece más opciones para combinar datos mediante esquemas que se ajusten al análisis.

En Tableau 2020.2 y versiones posteriores, se ha añadido una capa lógica por encima de la capa física en la fuente de datos. Cada tabla lógica contiene tablas físicas en una capa física.

En versiones anteriores de Tableau, el modelo de datos de la fuente de datos consistía en una sola capa física donde se podían especificar uniones de filas y columnas. Las tablas añadidas a la capa física (con unión de filas o columnas) crean una única tabla plana (no normalizada) para el análisis.

Versiones anteriores   2020.2 y posteriores
 
En versiones de Tableau 2020.2, el modelo de datos solo tenía la capa física   En la versión 2020.2 y versiones posteriores, el modelo de datos tiene dos capas: la capa lógica y la capa física

En Tableau 2020.2, el modelo de datos de la fuente de datos ahora incluye una nueva capa semántica sobre la capa física (llamada capa lógica) en la que puede añadir varias tablas y relacionarlas entre sí. Las tablas de la capa lógica no se fusionan en la fuente de datos, siguen siendo independientes (normalizadas) y mantienen su nivel de detalle nativo.

Actúan como contenedores para las tablas físicas fusionadas. Una tabla lógica puede contener una sola tabla física. También puede contener varias tablas físicas combinadas a través de uniones de filas o de columnas.

Construir un nuevo modelo

Al agregar una o más tablas a la capa lógica, se está creando el modelo de datos para la fuente de datos. Una fuente de datos puede estar compuesta por una sola tabla lógica o, también, puede arrastrar varias tablas al lienzo para crear un modelo más complejo.

  • La primera tabla que arrastre al lienzo se convierte en la tabla raíz del modelo de datos en la fuente de datos.
  • Después de arrastrar la tabla raíz, puede arrastrar tablas adicionales en cualquier orden. Deberá tener en cuenta qué tablas deben estar relacionadas entre sí y los pares de campos coincidentes que defina para cada relación.
  • Si va a crear un esquema de estrella, puede ser útil arrastrar primero la tabla de hechos y, a continuación, relacionar las tablas de dimensiones con esa tabla.
  • Al eliminar una tabla en el lienzo, también se eliminan automáticamente sus descendientes relacionados. Si elimina la tabla raíz, también se eliminan todas las demás tablas del modelo.
  • Cada relación debe estar formada por, al menos, un par de campos coincidentes. Añada varios pares de campos para crear una relación compuesta. Los pares de campos deben tener el mismo tipo de datos. Cambiar el tipo de datos en la página de fuente de datos no cambia este requisito. Tableau seguirá utilizando el tipo de datos de la base de datos subyacente para las consultas.
  • Las relaciones pueden formarse en función de los campos calculados.
  • Puede especificar cómo se deben comparar los campos utilizados en las relaciones mediante operadores al definir la relación.

Nota: No puede editar el modelo de datos en una fuente de datos publicada.

Para obtener más información acerca de las relaciones, consulte Crear y definir relaciones en Relacione sus datos.

Modelos multitabla

  • Para crear un modelo de varias tablas, arrastre las tablas a la capa lógica del lienzo de la página de fuente de datos.


Las tablas que se arrastran a la capa lógica del lienzo de la página de fuente de datos deben estar relacionadas entre sí. Al arrastrar tablas adicionales al lienzo de capa lógica, Tableau intenta crear automáticamente la relación en función de las restricciones clave existentes y los campos coincidentes para definir la relación. Si no puede determinar los campos coincidentes, deberá seleccionarlos.

Si no se detecta ninguna restricción, se crea una relación de varios a varios y la integridad referencial se establece en Algunos registros coinciden. Esta configuración predeterminada es una opción segura y proporciona la mayor flexibilidad para la fuente de datos. La configuración predeterminada admite uniones externas completas de columnas y optimiza las consultas agregando datos de tabla antes de formar uniones de columnas durante el análisis. Todos los datos de las columnas y filas de cada tabla se pueden analizar.

Puede agregar más datos dentro de cualquier tabla lógica haciendo doble clic en la tabla. Esto abre la capa física del lienzo de la página de fuente de datos. Si necesita utilizar uniones de filas o columnas, puede arrastrar las tablas en las que quiera hacerlo al lienzo de la capa física. Las tablas físicas se combinan en su tabla lógica.

Siga los pasos descritos en Crear y definir relaciones para combinar varias tablas.

Modelos de tabla individual

  • Para crear un modelo de tabla individual, arrastre una tabla al lienzo de capa lógica de la página de fuente de datos. A continuación, puede usar los campos de esa tabla en el panel Datos para el análisis.

Modelo de tabla individual que contiene otras tablas

Puede agregar más datos dentro de la única tabla lógica haciendo doble clic en la tabla. Esto abre la capa física del lienzo de la página de fuente de datos. Si necesita utilizar uniones de filas o columnas, puede arrastrar las tablas en las que quiera hacerlo al lienzo de la capa física. Las tablas físicas se combinan en su tabla lógica.

En este ejemplo se muestra la tabla Libro en el lienzo Relaciones (capa lógica) de la fuente de datos. Al hacer doble clic en la tabla lógica Libro, se abre el lienzo Unión de filas/Unión de columnas (capa física).

En este ejemplo, las combinaciones fusionan las tablas Premio e Info con la tabla Libro. En este caso, la unión entre Libro y Premio será de uno a varios, a nivel de detalle de los premios. Esto duplicaría los valores de medida para Libro e Info. Para evitar la duplicación, puede relacionar Premio e Info con Libro en lugar de unirlos dentro de la tabla lógica Libro.

Esquemas de modelos de datos admitidos

Las funcionalidades de modelado de datos introducidas en la versión 2020.2 de Tableau están diseñadas para simplificar el análisis sobre escenarios de datos comunes de varias tablas, incluidos los modelos de datos de estrellas y copo de nieve. Los siguientes tipos de modelos son compatibles con las fuentes de datos de Tableau.

Tabla individual

El análisis en una sola tabla lógica que contiene una mezcla de dimensiones y medidas funciona igual que en versiones anteriores a Tableau 2020.2. Puede crear una tabla lógica mediante una combinación de uniones de filas, de columnas, SQL personalizado, etc..

Estrella y copo de nieve

En los almacenes de datos empresariales, es común tener datos estructurados en "estrella" o "esquemas de copo de nieve" donde las medidas están contenidas en una tabla de hechos central y las dimensiones se almacenan por separado en tablas de dimensiones independientes. Esta organización de datos admite muchos flujos de análisis comunes, incluidos el resumen y la obtención de detalles.

Estos modelos se pueden representar directamente con relaciones en las funcionalidades de modelado de datos disponibles a partir de Tableau 2020.2.

Arrastre primero la tabla de hechos al modelo y, a continuación, relacione las tablas de dimensiones con la tabla de hechos (en un esquema de estrella) o a otras tablas de dimensiones (en un copo de nieve).

Normalmente, en un esquema de estrella o copo de nieve bien modelado, las relaciones entre la tabla de hechos y las tablas de dimensiones serán de varios a uno. Si esta información está codificada en el almacén de datos, Tableau la usará automáticamente para establecer las opciones de rendimiento de la relación. Si no es así, puede establecer esta información usted mismo. Para obtener más información, consulte Optimizar consultas de relación usando las opciones de rendimiento.

En un esquema de estrella o copo de nieve bien modelado, cada fila de la tabla de hechos tendrá una entrada coincidente en cada una de las tablas de dimensiones. Si esto es cierto y se captura en las restricciones de integridad del almacén de datos, Tableau utilizará automáticamente esta información para establecer la configuración de integridad referencial en Opciones de rendimiento. Si algunas filas de tabla de hechos no tienen una fila coincidente en una tabla de dimensiones (a veces denominadas "dimensiones de llegada tardía" o "hechos de llegada temprana"), Tableau conservará de forma predeterminada todas las filas al calcular medidas, pero puede quitar valores al mostrar encabezados de dimensión. Para obtener más información, consulte Optimizar consultas de relación usando las opciones de rendimiento.

Estrella y copo de nieve con medidas en más de una tabla

En algunos esquemas de estrellas o copo de nieve, todas las medidas para su análisis se incluyen en la tabla de hechos. Sin embargo, a menudo es cierto que pueden estar relacionadas medidas adicionales de interés con las tablas de dimensiones del análisis. Incluso si las tablas de dimensiones no contienen medidas, es común en el análisis querer contar o agregar valores de dimensión. En estos casos, la distinción entre tablas de hechos y tablas de dimensiones es menos clara. Para obtener esa claridad al ver el modelo de datos, se recomienda agregar primero la tabla de grano más fina al lienzo de la fuente de datos y, a continuación, relacionar todas las demás tablas con esa primera tabla.

Si se unieran estas tablas en una única tabla lógica, las medidas de las tablas de dimensiones se replicarían, lo que daría lugar a agregados distorsionados a menos que tomara precauciones para deduplicar los valores mediante cálculos LOD o COUNT DISTINCT. Sin embargo, si en su lugar crea relaciones entre estas tablas, Tableau agregará medidas antes de realizar combinaciones, evitando el problema de duplicación innecesaria. Esto le libera de la necesidad de realizar un seguimiento cuidadoso del nivel de detalle de sus medidas.

Análisis de varios hechos

Las funcionalidades de modelado de datos de Tableau admiten algunas formas de análisis de varios hechos. Se pueden agregar tablas de hechos adicionales (que contienen medidas) a cualquiera de los modelos mencionados anteriormente, siempre que solo se relacionen con una sola tabla de dimensiones. Esto se puede utilizar, por ejemplo, para reunir dos o más tablas de hechos y analizar una dimensión compartida, como en los análisis Customer 360. Estas tablas de hechos pueden tener un nivel de detalle diferente al de la tabla de dimensiones o entre sí. También pueden tener una relación de varios a varios con la tabla de dimensiones. En estos casos, Tableau se encargará de que los valores no se dupliquen antes de la agregación.

Si no tiene una tabla de dimensiones compartida que relacione las tablas de hechos, a veces puede crear dinámicamente una mediante SQL personalizado o mediante uniones de filas o de columnas de otras tablas de dimensiones.

Dos tablas de hechos se pueden relacionar directamente entre sí en una dimensión común. Este tipo de análisis funciona mejor cuando una de las tablas de hechos contiene un superconjunto de la dimensión común.

Modelos no compatibles

  • Varias tablas de hechos relacionadas con varias tablas de dimensiones compartidas. En algunos casos de uso, es común tener varias tablas de hechos relacionadas con varias tablas de dimensiones compartidas. Por ejemplo, puede tener dos tablas de hechos, Ventas de tienda y Ventas por Internet, relacionadas con dos tablas de dimensiones comunes, Fecha y Cliente. Normalmente, estos casos requerirían la creación de una relación circular en el modelo de datos. Las relaciones circulares no se admiten en la versión 2020.2.

    Puede crear un tipo de modelo similar fusionando algunas de las tablas de la capa física. Por ejemplo, es posible que pueda unir Ventas de tiendas y Ventas por Internet en una sola tabla, que puede relacionarse con Fecha y Cliente. Como alternativa, es posible que pueda unir Fecha y Cliente para crear una única tabla de dimensiones que, a continuación, se puede relacionar con Ventas de tienda y Ventas por Internet.

  • Relacionar directamente 3 o más tablas de hechos en dimensiones compartidas. Aunque es posible crear este modelo en la capa lógica, es posible que vea resultados no deseados, a menos que solo utilice dimensiones de una sola tabla.

Requisitos para las relaciones en un modelo de datos

  • Al relacionar las tablas, los campos que definan las relaciones deben tener el mismo tipo de datos. Cambiar el tipo de datos en la página de fuente de datos no cambia este requisito. Tableau seguirá utilizando el tipo de datos de la base de datos subyacente para las consultas.
  • No puede definir relaciones basadas en campos geográficos.
  • Las relaciones circulares no se admiten en el modelo de datos.
  • No puede editar relaciones en una fuente de datos publicada.
  • No puede definir relaciones entre fuentes de datos publicadas.
  • El libro de trabajo debe utilizar una fuente de datos insertada para poder editar las relaciones y las opciones de rendimiento en la página de fuente de datos de Tableau Online o Tableau Server.

Factores que limitan las ventajas del uso de tablas relacionadas

  • Los datos sucios de las tablas (es decir, tablas que no se crearon teniendo en cuenta un modelo bien estructurado y que contienen una combinación de medidas y dimensiones en varias tablas) pueden hacer que el análisis de varias tablas sea más complejo.
  • El uso de filtros de fuentes de datos limitará la capacidad de Tableau para realizar la separación de uniones en los datos. "Separación de uniones" es un término que explica la forma en que Tableau simplifica las consultas mediante la eliminación de uniones innecesarias.
  • Tablas con una gran cantidad de valores no coincidentes entre relaciones.
  • Relación de varias tablas de hechos con varias tablas de dimensiones (intentando modelar dimensiones compartidas o compatibles).
¡Gracias por sus comentarios!