Cuándo utilizar un modelo de relación multifactor

Un modelo de relación multifactor es un modelo de datos que le permite agregar tablas no relacionadas en una única fuente de datos y luego utiliza campos relacionados durante el análisis visual para esencialmente anexar las tablas según el contexto. A diferencia de la combinación, los datos existen dentro de una única fuente de datos: los conceptos de fuentes de datos principales y secundarias no se aplican y no se eliminan datos de las combinaciones izquierdas. A diferencia de un modelo de datos de una sola tabla, varias tablas base mantienen su propio contexto respecto a las tablas compartidas entre ellos. Un modelo de datos de relaciones multifactor le brinda más opciones para realizar análisis multifactor en Tableau.

Imagine que desea analizar la tendencia conjunta del clima y las ventas de helados. El clima y las ventas de helados ocurren en momentos y lugares específicos, pero no existe una conexión directa entre las ventas de helados y el clima. Estos son datos no relacionados que se relacionan con los conceptos compartidos de fecha y ubicación.

Esta pregunta se presta a la creación de un modelo de relación multifactor. Las ventas de helados y el clima se pueden agregar como una tabla base y relacionarse en Fecha y Ubicación, que son tablas compartidas.

un modelo de datos de múltiples tablas base con dos tablas base y dos tablas compartidas

Un modelo de datos de múltiples tablas base, con dos tablas no relacionadas (Ventas de helados y Clima) y dos tablas compartidas (Fecha y Ubicación). Hay una tabla intermedia, Información del salón, entre Ventas de helados y Ubicación.

¿Por qué desarrollamos la capacidad de modelar tablas no relacionadas?

El análisis a menudo implica reunir tablas de datos que ni siquiera tienen una relación directa entre sí, pero que ambos se relacionan con la misma información común (como la fecha o la ubicación). Un modelo de relación multifactor admite un acoplamiento semántico flexible al introducir el concepto de grados de relación y la capacidad de construir un modelo de datos con múltiples tablas base no relacionadas.

  • El acoplamiento semántico es un término utilizado para describir cuán estrechamente se combinan los datos. Una unión de columnas o de filas son similares, pero con pequeñas diferencias; reúnen varias tablas en una nueva tabla física que luego actúa como una sola tabla. Una relación es un acoplamiento más flexible entre tablas que une las tablas de manera lógica, manteniendo su estado distintivo como tablas separadas. Aún más lejos en el espectro de acoplamiento semántico está la combinación de datos, donde los resultados de fuentes de datos independientes se combinan visualmente en función de elementos compartidos entre ambas. Un modelo de relación multifactor está más cerca del extremo de combinación del espectro, pero dentro de una única fuente de datos en lugar de entre fuentes de datos.

Un modelo de relación multifactor (un modelo de datos con múltiples tablas base) permite tablas no relacionadas en el modelo siempre que también existan tablas compartidas en el modelo. Durante el análisis, los campos de una tabla compartida "anexan" tablas de datos que de otro modo no estarían relacionadas en función de las dimensiones compartidas que tienen en común (como que suceden en el mismo lugar o al mismo tiempo). Se mantienen todos los beneficios de las relaciones, incluida la retención del grano de cada tabla o nivel nativo de detalle.

De manera similar a un modelo de datos de tabla base única, Tableau determina el mejor tipo de combinación para usar en segundo plano según la estructura de la visualización. Pero en un modelo de relación multifactor, las opciones de unión se amplían para incluir uniones externas y cruzadas para manejar diferentes niveles de relación. Para obtener más información, consulte Acerca de los modelos de datos de relaciones multifactor.

¿De dónde proviene el nombre?

Las relaciones multifactor reciben su nombre del análisis multifactor. En un modelo de almacén de datos, los datos se almacenan en una tabla de hechos central rodeada de tablas de dimensiones. En este contexto, hechos se refiere a medidas o métricas, que son campos numéricos de datos que capturan hechos sobre los datos: las medidas de Tableau. Las tablas de dimensiones contienen atributos sobre estos factores.

Los esquemas basados en tablas de hechos suelen estructurarse como una estrella o un copo de nieve, dependiendo de cómo estén organizadas las tablas de dimensiones. Cuando es necesario realizar un análisis en tablas de hechos, esto se denomina análisis de hechos múltiples. El análisis se realiza en el contexto de las tablas de dimensiones comunes, conocidas como dimensiones compartidas o dimensiones conformadas. En Tableau, estos modelos de datos se crean mediante relaciones, por lo que denominamos a este conjunto de capacidades relaciones multifactor.

Cuándo utilizar modelos de datos de relaciones multifactor

Si sus datos constan de tablas que están todas relacionadas entre sí, puede seguir con fuentes de datos de tabla base única creadas con relaciones. Se requiere un modelo de relación multifactor cuando sus datos abarcan diferentes conceptos, ya sea en forma de múltiples tablas de hechos o diferentes contextos no relacionados.

Siempre que sea posible, cree sus fuentes de datos con una única tabla base. En un modelo de datos de tabla base única, cada tabla está relacionada y no es necesario considerar grados de relación. Utilice únicamente relaciones multifactor cuando sea necesaria la estructura del modelo de datos.

Análisis de varios hechos

El análisis multifactor es un caso de uso central para las relaciones multifactor en Tableau. En este ejemplo, el hecho A y el hecho B comparten una tabla Fecha.

un modelo de datos multifactor

Para modelar esto en Tableau, las tablas de hechos se convierten en tablas base y se establecen múltiples relaciones entrantes para su tabla de dimensiones compartida.

un modelo de datos de relaciones multifactor

Otros escenarios

Sin embargo, los modelos de datos de relaciones multifactor no son sólo para análisis multifactor. Tableau no requiere una definición estricta de tablas de hechos o dimensiones. Cualquier tabla puede ser tabla base (aunque debe adaptarse a las características de las tablas base). Algunos escenarios que indican una fuente de datos de varias tablas base que pueden resultar útiles incluyen: 

  • Pasando por etapas, como tablas base para solicitudes, expedientes académicos y eventos de exestudiantes para una tabla de estudiantes compartida.
  • Diferentes contextos para los mismos eventos, como tablas base para los eventos de citas médicas y facturas, con tablas compartidas para establecer el contexto a médicos o pacientes.
  • Diferentes dominios que pueden correlacionarse, como escenarios que antes se manejaban mejor con la combinación de datos, como las ventas de helados y el clima correlacionados a través de tablas compartidas de fecha y ubicación.

Identificar las tablas base

En un modelo de relación multifactor, la direccionalidad importa. Es decir, qué tablas son las tablas base en el lado izquierdo del modelo y qué tablas se comparten en sentido descendente influye en la forma en que se evalúan las relaciones para devolver los resultados analíticos.

Considere una pajarita conceptual de facturas, citas, médicos y pacientes:

un modelo de datos tipo pajarita con facturas y citas en el exterior y médicos y pacientes en el medio

La forma correcta de crear el modelo de datos en Tableau es con Facturas y Citas como tablas base, y con Médicos y Pacientes como tablas compartidas (no con Médicos y Pacientes como tablas base).

Correcto: Facturas y Citas como tablas base

Incorrecto: Médicos y Pacientes como tablas base

un modelo de datos de múltiples tablas base con facturas y citas como bases y médicos y pacientes como tablas compartidas descendentesun modelo de datos de múltiples tablas base con médicos y pacientes como tablas base y facturas y citas como tablas compartidas descendentes

Conceptualmente, un paciente (o médico) es la entidad que anexa el evento de una cita y el evento de una factura.

Si su modelo de datos está al revés (por ejemplo, con Médicos y Pacientes como tablas base en lugar de Citas y Facturas), el comportamiento de anexo exterior no será tan útil. Su análisis puede mostrar muchas medidas de alcance de tabla y ambigüedad. Si se encuentra con campos ambiguamente relacionados que no esperaba, vuelva a evaluar las tablas que está utilizando como tablas base y vea si es necesario revertir su modelo de datos.

Características de las tablas base y tablas compartidas

Si realiza un análisis multifactor, las tablas de hechos se convierten en tablas base y las tablas de dimensiones compartidas son tablas compartidas. Tableau no requiere un cumplimiento estricto de las características de las tablas de hechos y dimensiones. Sin embargo, existen ciertos atributos que pueden ayudarle a identificar qué tablas deben ser tablas base y cuáles deben ser tablas compartidas.

Tabla base

Tabla compartida

Tablas de hechos en un esquema de almacén de datos

Tablas de dimensiones compartidas o conformadas en un esquema de almacén de datos

Específico del contexto o análisis.

(información de vuelo, uso de energía)

Concepto consistente en varios contextos

(fecha, ubicación)

Medida pesada

Principalmente dimensiones

Actualizado con más frecuencia/transaccional

(citas médicas, recetas, signos vitales)

Más estable/duradero

(médico, paciente)

Tiene campos de clave externa

Tiene campos de clave principal

Basado en eventos

(horario de clases, calificación de una tarea)

Basado en entidad

(estudiante, aula)

Tenga en cuenta que si hay tablas intermedias entre una tabla base y una tabla compartida, puede intercambiar la tabla base sin alterar fundamentalmente el modelo de datos. (Como información dela clase y ventas de helados en el primer ejemplo). Lo que importa es qué tablas son ascendentes de las tablas compartidas y cuáles son compartidas.

Probar con una tabla base adicional

Hay varios escenarios que pueden indicar que se debe crear un modelo de relación multifactor con varias tablas base en lugar de una única fuente de datos de tabla base:

  • Si está intentando crear una fuente de datos con un ciclo, la tabla descendente debería ser otra tabla base.
  • Si tiene una serie de tablas que están relacionadas en los mismos conjuntos de cláusulas de relación (como fecha y ubicación), esas dimensiones deben extraerse y convertirse en tablas compartidas.
    • Esto es especialmente útil porque varias cláusulas de relación deben ser todas verdaderas (lógicamente, un AND) para que las tablas estén relacionadas para esos registros.
    • Si, en cambio, desea analizar registros donde uno puede ser verdadero a la vez (un OR contextual), esta flexibilidad se proporciona configurando un modelo de datos con tablas de dimensiones compartidas.
  • Si está utilizando una combinación pero desea tener una combinación equivalente sin fuentes de datos principales y secundarias, cree un modelo de datos que combine las fuentes de datos de la combinación con sus campos de enlace en una tabla o tablas compartidas.
¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!