Acerca de los modelos de datos de relaciones multifactor

Las relaciones multifactor le permiten crear fuentes de datos con más de una tabla base. El uso de varias tablas base en su modelo de datos le permite realizar análisis multivariante en Tableau.

Al establecer árboles de tablas, basadas en una tabla base, puede modelar estructuras de datos con diferentes dominios conceptuales y utilizar sus características compartidas para conectarlas. Este tipo de análisis a menudo se denomina análisis multivariante, dimensiones conformadas o dimensiones compartidas. En Tableau, lo llamamos modelo de datos de relaciones multifactor porque se utilizan relaciones para construirlo. Un modelo de datos de relaciones multifactor siempre contiene varias tablas base. Las tablas base son las tablas situadas más a la izquierda en el modelo de datos. Para obtener orientación sobre cómo determinar qué tablas usar como tablas base, consulte Cuándo utilizar un modelo de relación multifactor.

un modelo de tabla base múltiple con un árbol resaltado

Un modelo de datos de varias tablas base con el árbol de una tabla base resaltado.

Niveles de relación

Los modelos de datos con múltiples tablas base tienen mucha flexibilidad en cuanto a cómo los datos pueden relacionarse (o no) entre sí.

Nota: La relación en cualquier nivel solo es relevante en modelos de datos con múltiples tablas base. Antes de los modelos de datos de relaciones multifactor, todo estaba relacionado (dentro de una única fuente de datos) o nada (mezclando múltiples fuentes de datos).

Relación en el modelo de datos

Las tablas están relacionadas, no relacionadas o compartidas según la estructura del modelo de datos. En una fuente de datos, la relación de las tablas es una constante. Como una breve descripción: 

  • Las tablas relacionadas están en el mismo árbol.
    • Antes de la versión 2024.2, todas las fuentes de datos eran fuentes de datos de tabla base única que constaban de un solo árbol, y en una fuente de datos de tabla base única todas las tablas están relacionadas.
  • Las tablas no relacionadas están en diferentes árboles. Las tablas base nunca están relacionadas entre sí. Las tablas que están en el nivel inferior exactamente de una tabla base tampoco están relacionadas con las tablas de otros árboles.
  • Las tablas compartidas tienen múltiples relaciones entrantes y pertenecen a más de un árbol.
    • Las tablas descendentes de una tabla con múltiples relaciones entrantes también se consideran compartidas.

Relación durante el análisis

Los campos pueden estar relacionados, no relacionados, aún sin relacionar, ambiguamente relacionados o pueden actuar como campos de anexo. La relación entre un grupo de campos se determina hoja por hoja según la estructura del modelo de datos, qué campos están en uso activo (es decir, en los estantes como campos) y si esos campos son dimensiones o medidas.

una visualización simple con dos campos no relacionados, uno en filas y otro en columnas, y una descripción emergente no relacionada que se muestra

Para realizar una visualización con campos de varias tablas, Tableau debe realizar uniones en segundo plano para calcular los valores. El tipo de unión utilizada depende de la relación de los campos. Como una breve descripción: 

  • Cuando se utilizan campos relacionados en una visualización, las dimensiones se unen internamente y los valores de medida se desglosan por dimensiones.
    • Es un poco más complicado que eso: es posible que se necesiten uniones adicionales en segundo plano para garantizar que no se eliminen valores de medida. Pero en una visualización de solo dimensiones, las dimensiones relacionadas están unidas internamente y ese es el concepto principal aquí.
    • Este es el mismo comportamiento que los modelos de tabla de base única.
  • Cuando se utilizan campos no relacionados en una visualización, las dimensiones están unidas en cruz. Los valores de medida tienen un alcance de tabla (es decir, se agregan localmente a un único valor para toda la tabla) y se repiten.
    • También es posible que los campos estén sin relacionar aún o ambiguamente relacionados, lo que significa que para la combinación de campos activos, existe más de una forma de resolver las relaciones entre sus tablas. Si Tableau encuentra incertidumbre, trata los campos como si no estuvieran relacionados.
  • Cuando los campos están anexados basándose en un campo compartido, las dimensiones se unen externamente. Los valores de las medidas se agregan al nivel de cualquier dimensión en la que se puedan desglosar y repetir.
    • Las dimensiones de anexo son similares a los campos vinculantes en la combinación de datos. Los resultados se calculan para cada par de campos relacionados y, luego, los valores no relacionados se anexan entre los valores compartidos de la dimensión compartida entre ellos.

Todos estos conceptos y definiciones se analizan con más detalle más adelante en este tema.

Un aparte sobre dimensiones y medidas.

En Tableau, las medidas son agregaciones: se agregan hasta la granularidad establecida por las dimensiones de la vista. Por tanto, el valor de una medida depende del contexto de las dimensiones. Por ejemplo, “cantidad de cajas de cereal” depende de si nos referimos al inventario total o al número de cajas por marca.

Las dimensiones suelen ser campos categóricos, como país o marca. En Tableau, las dimensiones establecen la granularidad o el nivel de detalle de la vista. Normalmente queremos agrupar nuestros datos en marcas según alguna combinación de categorías. Las dimensiones que utilizamos para construir la vista determinan cuántas marcas tenemos.

Cuando una medida se utiliza sin dimensiones, se dice que se trata de un alcance de tabla. Esto significa que su valor es el valor completamente agregado para toda la tabla. Tan pronto como utilizamos una dimensión como la marca en la visualización, la medida se desglosa de forma más granular. El número total de cajas de cereales ahora es por marca.

La agregación se refiere a la forma de combinar los datos. La agregación predeterminada de Tableau es SUM. Puede cambiar la agregación a otras opciones, como Promedio, Mediana, Conteo distinto, Mínimo, etc. La granularidad se refiere a qué tan detallada o desglosada está la medida, lo cual está controlado por las dimensiones. A menos que la granularidad de la medida sea a nivel de fila (también conocida como desagregada), su valor debe agregarse.

Ejemplo

una tabla de valores para el número de cajas de cereal, en cinco marcas y tres tamaños de cajas

¿Cuál es el valor del "número de cajas de cereal"?

Bueno, depende del tipo de agregación y de la granularidad establecida por las dimensiones.

  • Agregaciones:
    • Suma (o total)
    • Promedio
  • Granularidad:
    • Alcance de tabla/totalmente agregado (las barras azules en el ejemplo)
    • Desglosado por la dimensión Marca (las barras de colores en el ejemplo)

Un panel con cuatro visualizaciones, una para el número sumado de cajas con alcance de tabla (54), otra con el número promedio de cajas con alcance de tabla (6) y luego versiones de esas dos desglosadas por las cinco marcas.

Indicadores de relación a nivel de campo

Hay varias pistas visuales que pueden ayudarle a comprender el grado de relación de los campos que está utilizando en un análisis.

Indicadores de relación en una hoja de trabajo

  • Icono no relacionado: Tableau usa un icono no relacionado icono no relacionado para indicar que no todo lo que aparece en la vista está relacionado. Si ve un icono no relacionado en un campo en la vista o en el panel Datos, puede colocar el cursor sobre el icono para obtener más información.
    • El icono relacionado indica que el campo está anexando campos no relacionados.
  • Nombres de campos en gris claro: los nombres de los campos se muestran en texto gris claro en el panel Datos cuando no están relacionados con cualquier campo en uso en los estantes. Aún puede utilizar estos campos para el análisis en esa visualización, pero los campos no relacionados se evaluarán de manera diferente en el análisis que los campos que están relacionados. Al pasar el ratón, estos campos también muestran un icono no relacionado.

el panel Datos, con una tabla entera atenuada y dos campos con el icono del ojo cortado para campos ocultos

Nota: En versiones anteriores de Tableau, los nombres de los campos en gris claro indicaban que los campos estaban ocultos y que se había seleccionado la opción Mostrar campos ocultos. Los campos ocultos, cuando se muestran, ahora se indican con un icono de ojo en el que se puede hacer clic icono de campo oculto.

Cuadro de diálogo de advertencia de relación

Cuando se utilizan campos no relacionados juntos en una visualización, Tableau muestra un cuadro de diálogo de advertencia para informarle de que los campos no están relacionados. Esta advertencia aparece cada vez que se agrega un campo no relacionado para evitar uniones cruzadas accidentales que podrían afectar el rendimiento.

  • Si desea utilizar campos no relacionados sin unirlos, haga clic en Agregar para continuar agregando el campo a la visualización.
  • Si desea unir campos no relacionados, una buena práctica es resaltar el campo que se está uniendo antes que un campo que de otra manera no estaría relacionado. El cuadro de diálogo no se mostrará si el campo de anexo ya está en uso. Consulte Cómo se utilizan las uniones para cada nivel de relación para obtener más información sobre cómo el anexo evita las uniones cruzadas.

el cuadro de diálogo de advertencia de relación que muestra una advertencia para dimensiones no relacionadas

Si se están agregando varios campos o ya están presentes en la vista, el área Detalles aparece en el cuadro de diálogo. Amplíela para ver más información sobre la relación de todos los campos en uso e identificar de dónde proviene el problema de la falta de relación.

el cuadro de diálogo de advertencia de relación con un mensaje para dimensiones y medidas no relacionadas, y con el área Detalles expandida

Para evitar que aparezca el mensaje de advertencia, seleccione la opción No mostrar esto otra vez. Siempre puede volver a habilitar estos mensajes de advertencia activándolos nuevamente:

  • En Tableau Desktop, abra el menú Ayuda > Configuración y rendimiento > Restablecer mensajes ignorados.
  • En un navegador, borre los datos almacenados en caché. Por ejemplo, en Chrome, abra el Menú de 3 puntosEliminar datos de navegación... > Seleccione "Imágenes y archivos almacenados en caché" > Eliminar datos.

Relación a nivel de tabla en el modelo de datos

En un modelo de datos con múltiples tablas base, cada tabla base define un conjunto de tablas que están relacionadas y forman un árbol conceptual. Estos árboles deben estar conectados mediante al menos una tabla compartida para garantizar que la fuente de datos general sea una entidad única.

Lo que antes podrían haber sido dos fuentes de datos que podrían combinarse mediante campos vinculados ahora pueden ser una única fuente de datos con dos árboles, conectados por tablas compartidas que contienen esos campos comunes.

dos modelos de datos, uno formado por dos fuentes de datos distintas, una de las dos fuentes de datos superpuesta a las tablas que tienen en común para formar una única fuente de datos

Consejo: La forma en que se relacionan las tablas en el modelo de datos afecta a la forma en que se pueden relacionar sus campos en el análisis. Puede resultar útil volver a consultar la pestaña Fuente de datos durante el análisis para ver cómo encaja una tabla en el modelo de datos general.

Veamos qué tablas están relacionadas, no relacionadas o compartidas usando esta fuente de datos de ejemplo. Hay dos árboles, uno establecido por la Tabla base A y otro por la Tabla base B.

Tablas no relacionadas

Las tablas base no están fundamentalmente relacionadas. De manera similar, cualquier tabla que exista únicamente en un único árbol no está relacionada con las tablas de otros árboles.

La Tabla A y la Tabla X no están relacionadas.

La Tabla B y la Tabla X no están relacionadas.

Un modelo de datos donde las tablas base A y X tienen sus propios contornos. Las relaciones se muestran en gris claro.Un modelo de datos donde las tablas base A y su tabla descendente B comparten un esquema. La tabla base X tiene su propio esquema. Las relaciones se muestran en gris claro.

Tablas relacionadas

Las tablas del mismo árbol se consideran relacionadas.

La tabla A y la tabla S están relacionadas

La Tabla B y la Tabla S están relacionadas (a través de la Tabla A)

Un modelo de datos donde se enfatiza la relación de la tabla base A con una tabla posteriorUn modelo de datos donde la relación de la Tabla B con otra tabla se enfatiza por sus relaciones con la misma tabla base, A

Tablas compartidas

Las tablas compartidas tienen múltiples relaciones entrantes. Estas tablas pertenecen a varios árboles y se comparten entre ellos.

La Tabla S y la Tabla T se comparten.

Un modelo de datos donde las tablas S y T tienen múltiples relaciones entrantes. Ambas pertenecen al árbol de la tabla base A y al árbol de la tabla base X.

Relación a nivel de campo en el análisis.

La relación entre campos se determina hoja por hoja según la estructura del modelo de datos, qué campos se utilizan activamente (es decir, qué campos están en la visualización como campos en los estantes) y si esos campos son dimensiones. o medidas. El impacto de la relación de campo en los resultados de una visualización se aborda en la siguiente sección.

Repasemos algunos escenarios utilizando la misma fuente de datos de ejemplo. El nombre de cada campo indica de qué tabla proviene, como CampoB de la Tabla B. Los campos pueden ser dimensiones o medidas a menos que se indique lo contrario.

Campos relacionados

En un nivel alto, los campos están relacionados cuando Tableau puede determinar claramente cómo evaluarlos juntos en función de una ruta de relación dentro de un único árbol.

Por ejemplo, CampoB (de la Tabla B) y CampoS (de la Tabla S) están relacionados.

CampoB y CampoS están relacionados

Campos no relacionados

En un nivel alto, los campos no están relacionados en ningún caso cuando no lo están. Esto podría deberse a que los campos provienen de tablas no relacionadas, como por ejemplo el uso de campos de dos tablas base. En este caso, los campos de diferentes tablas base básicamente no están relacionados.

Por ejemplo, CampoA y CampoX no están relacionados.

CampoA y CampoX no están relacionados

O los campos pueden considerarse como no relacionados durante un momento determinado, como en casos ambiguamente relacionados o sin relacionar aún. En su mayor parte, puede confiar en indicadores de relación para avisarle cuando los campos no están relacionados en el contexto de una visualización.

Dimensión de anexo

Anexar es la forma en que Tableau evalúa campos de tablas no relacionadas en un modelo de datos multivariante durante el análisis. En una visualización, el uso de una dimensión de una tabla compartida anexa campos que de otro modo no estarían relacionados y permite evaluarlos simultáneamente en la misma visualización. Piense en esto como yuxtaponer los resultados de dos árboles en función de una dimensión que comparten.

Por ejemplo, si se crea una visualización con CampoA y CampoX, estos dos campos no están relacionados. Agregar DimensiónS introduce un campo de anexo.

  • CampoA y DimensiónS se evalúan juntos.
  • CampoX y DimensiónS se evalúan juntos.
  • Esos resultados intermedios se reúnen en función de los valores de DimensiónS.
  • CampoA y CampoX ahora están anexados.

tablas base no relacionadas A y X anexadas por su tabla compartida S

Consejo: Una práctica recomendada es utilizar un campo de anexo en la visualización antes de mostrar un campo no relacionado. Por ejemplo, arrastre primero DimensiónS, o CampoA, luego DimensiónS y luego CampoX, en lugar de CampoA, luego CampoX y luego DimensiónS. Agregar primero el campo de anexo garantiza que Tableau siempre sepa cómo evaluar las relaciones y evita posibles problemas de rendimiento al evaluar dimensiones no relacionadas juntas con uniones cruzadas.

Anexar requiere que una dimensión de una tabla compartida esté activa en la visualización. Los campos colocados en el estante Filtros o en la propiedad Descripción emergente de la tarjeta Marcas no se consideran activos a los efectos del anexo.

Campos aún no relacionados

Los campos también pueden tener múltiples formas en las que podrían estar relacionados, pero aún no lo están. Esto sucede cuando hay más de una relación posible entre dos tablas compartidas (o tablas compartidas posteriores).

Considere CampoS y CampoT. Sus tablas están relacionadas entre sí tanto a través del árbol definido por la Tabla base A como a través del árbol definido por la Tabla base X.

En una visualización con solo CampoS y CampoT, no hay información sobre qué árbol se debe utilizar para relacionarlos. Sin información adicional, Tableau no puede evaluar si relacionar estos campos a través del árbol de la Tabla base A o del árbol de la Tabla base B.

CampoS y CampoT se tratan como sin relacionar aunque existen múltiples relaciones potenciales.

Campos ambiguos poco relacionados S y T

Estos campos que podrían estar (aunque todavía no están) relacionados se evalúan como campos no relacionados porque Tableau no puede determinar claramente su ruta de relación. A diferencia de los campos verdaderamente no relacionados que solo se pueden anexar, los campos sin relacionar aún se pueden resolver y los campos se pueden relacionar directamente.

Campos ambiguamente relacionados

Los campos también pueden estar relacionados de forma ambigua. Esto sucede cuando hay más de una relación posible activa entre tablas compartidas (o tablas compartidas descendentes). A diferencia de los campos aún no relacionados, que pueden considerarse hiporelacionados o poco relacionados, los campos ambiguamente relacionados están hiperrelacionados o sobrerelacionados.

Considere CampoS y CampoT. Sus tablas están relacionadas entre sí tanto a través del árbol definido por la Tabla base A como a través del árbol definido por la Tabla base X.

En una visualización con solo CampoA, Campo X, CampoS y CampoT, hay demasiada información para decidir qué árbol se debe utilizar para relacionarlos. Sin recortar la información, Tableau no puede evaluar si relacionar estos campos a través del árbol de la Tabla base A o del árbol de la Tabla base B.

Los campos S y T se tratan como no relacionados aunque existan múltiples relaciones activas.

Estos campos relacionados ambiguamente se evalúan como campos no relacionados porque Tableau no puede determinar claramente su ruta de relación. A diferencia de los campos verdaderamente no relacionados que solo se pueden anexar, los campos ambiguamente relacionados se pueden resolver y los campos se pueden relacionar directamente.

Medir desde una tabla compartida

Cuando se utiliza una dimensión de una tabla compartida, anexa los campos de sus tablas ascendentes no relacionadas. Sin embargo, la medida no se puede anexar, y el valor de una medida depende de sus dimensiones relacionadas.

En una visualización con DimensionA y DimensionX, estas dos dimensiones no están relacionadas. Si MeasureS se extrae de la Tabla S, no está relacionado con la combinación DimensionA y DimensionX juntas. Aunque podría estar relacionado con cualquiera de ellos independientemente, no puede estar relacionado simultáneamente con ambos en la misma visualización.

tablas base no relacionadas A y X anexadas por su tabla compartida S

Una medida compartida puede considerarse un tipo de ambigüedad o sobrerrelación y se resuelve de la misma manera.

Resolver relaciones poco claras entre campos

Siempre que haya incertidumbre sobre cómo relacionar los campos, Tableau no tomará una decisión arbitraria y, en cambio, los tratará como no relacionados. A menudo es mejor relacionar estos campos aclarando la incertidumbre en torno a qué árbol utilizar.

La resolución de campos sin relacionar aún se realiza agregando un campo para establecer qué árbol usar. La resolución de campos relacionados ambiguamente se realiza eliminando campos para establecer qué árbol utilizar.

Ejemplo:

Resolver aún no relacionados: añadir un campo

  • En una visualización de CampoS y CampoT, agregar un campo de la Tabla A, B o C a la visualización activa el árbol de la Tabla base A y resuelve la ruta deseada entre CampoS y CampoT.
  • Alternativamente, usar un campo de la Tabla X resuelve la ruta deseada entre CampoS y CampoT para basar el árbol de la Tabla X.

Resolver ambiguos relacionados: eliminar un campo o varios

  • En una visualización de FieldA, FieldX, FieldS y FieldT, eliminar FieldX hace que solo esté activo el árbol de la Tabla base A y resuelve la ruta deseada entre FieldS y FieldT.
  • Como alternativa, eliminar el FieldA resuelve la ruta deseada entre el FieldS y el FieldT a través del árbol de la Tabla Base X.

Resolver una medida compartida: eliminar un campo o varios

  • En una visualización de DimensionA, DimensionX y MeasureS, eliminar DimensionX hace que solo esté activo el árbol de la Tabla base A y resuelve la ruta deseada entre DimensionA y MeasureS.
  • Como alternativa, eliminar DimensionA resuelve la ruta deseada entre DimensionX y MeasureS a través del árbol de la Tabla Base X.
Aún no relacionadoRelacionado ambiguamenteRelación resuelta en un solo árbol
Relacionado a través de la tabla base ARelacionado a través de la tabla base X
poco relacionadorelacionado a través de Arelacionado a través de X

Resolver la incertidumbre es similar a utilizar una expresión de nivel de detalle (LOD) FIXED. En una expresión LOD FIXED, usted le indica a Tableau a qué nivel de detalle agregar definiendo la declaración de dimensión. La interticumbre se resuelve cambiando la estructura de la visualización para activar solo un árbol, lo que le indica a Tableau qué rutas de relación puede considerar para realizar el análisis.

Anexar o resolver incertidumbres

Tanto anexar como resolver la incertidumbre son formas de abordar la falta de relación, pero tienen resultados diferentes:

Anexar

Resolver la incertidumbre

Anexar A y X con S

CampoA y CampoX no relacionados anexados por DimensiónS

Resolver S y T con A

CampoS y CampoT evaluados a través del árbol definido por la Tabla base A

Yuxtapone campos no relacionados basados en atributos compartidosLimita la ruta de relación a utilizar cuando hay múltiples opciones (ambigüedad o una medida compartida), o establece una ruta de relación cuando no había ninguna (aún no están relacionadas).

Utiliza lógica de tabla base múltiple para calcular los resultados.

Utiliza lógica de tabla base única para calcular los resultados.

El análisis involucra tablas no relacionadas.El análisis implica tablas compartidas.

Cómo se utilizan las uniones para cada nivel de relación

Una vez determinada la relación a nivel de campo, Tableau debe evaluar los resultados para crear la visualización real. Las consultas utilizadas para calcular los valores mostrados en una visualización se basan en uniones. El hecho de que los campos estén relacionados, no relacionados o anexados tiene un impacto diferente en las uniones que se realizan. Recuerde: los campos ambiguamente relacionados y sin relacionar aún se tratan como no relacionados en este contexto.

Para explicar las relaciones y las uniones, esta sección cubre las tablas y sus campos, además de los valores en esos campos. Considere el siguiente modelo de datos con dos tablas base, Clases y Clubes, y una tabla compartida, Estudiantes.

Un modelo de datos con dos tablas base, clases y clubes, y una tabla compartida, estudiantes

Clases

Clubes

Estudiantes

ver datos para la tabla de clases, mostrando los valores de tres camposver datos de la tabla de clubes, mostrando los valores de tres camposver datos de la tabla de estudiantes, mostrando los valores de tres campos

Campos:

  • Clase, una dimensión con valores de Conceptos básicos de anidación, Canciones avanzadas, Vuelo para novatos y Llamadas de alarma 101
  • Longitud, una medida
  • Estudiante, una dimensión utilizada para relacionarse con la tabla de Estudiantes

Campos:

  • Club, una dimensión con valores de Fotografía, Viajes, Malabares, Arte y Primeros Auxilios
  • Deudas, una medida
  • Estudiante, una dimensión utilizada para relacionarse con la tabla de Estudiantes

Campos:

  • En autobús, una dimensión con valores de sí o no
  • Estudiante, una dimensión con valores de Finch, Cardinal, Sparrow, Robin y Jay. Se utiliza para relacionarse con las otras dos tablas.
  • Edad, una medida

Este modelo muy simple ilustra cómo se calcula la lógica de unión de alto nivel para modelos de datos de relaciones multifactor. Para obtener más información sobre los conceptos básicos de las uniones utilizadas en modelos de datos de tabla base única basados en relaciones, consulte Cómo funciona el análisis para fuentes de datos de varias tablas que utilizan relaciones.

¿Debería este ejemplo ser un modelo de datos con varias tablas base?

Para este modelo de datos de tres tablas, puede resultar tentador configurarlo como un modelo de tabla base única, como Clases-Estudiantes-Clubes o Clubes-Estudiantes-Clases, o con Estudiantes como tabla base. Como regla general, los modelos de datos de relaciones multifactor están destinados a tipos específicos de esquemas de datos o escenarios de análisis. Si su modelo de datos tiene características que se adaptan mejor a un modelo de datos de relaciones multifactor, configúrelo de esa manera para mantener sus tablas base conceptualmente no relacionadas. Sin embargo, si sus datos no requieren este tipo de estructura, un modelo de tabla base única puede ser más sencillo de usar.

Estructuras de modelo de datos alternativas para el modelo de ejemplo clases-clubes-estudiantes.

Modelos que podrían construirse para estas tres tablas: (1) Clases y Clubes como tablas base con Estudiantes como una tabla compartida, (2) linealmente, comenzando con Clases o Clubes, y (3) Estudiantes como una tabla base única con Clases y Clubes como tablas descendentes.

En este caso particular, no hay nada en estas tablas, los datos o el modelo que realmente requiera múltiples tablas base. Estamos usando este modelo como ejemplo para mantenerlo simple y poder centrarnos en la lógica de unión. O podría imaginar que hay otra tabla relacionada, Salas, que simplemente ignoramos para evitar complicar demasiado la discusión.

una versión del modelo clases-clubes-estudiantes con una tabla adicional compartida, salas

Sin embargo, como práctica recomendada, utilice únicamente un modelo de relación multifactor cuando sus datos lo requieran.

Las dimensiones relacionadas utilizan uniones internas

Las dimensiones relacionadas están unidas internamente. Las uniones internas eliminan los valores de dimensión que no se comparten en ambas tablas.

  • Tableau utiliza lógica adicional para garantizar que los valores de las medidas no se pierdan. Esta sección utiliza solo dimensiones para demostrar los conceptos básicos de cómo Tableau aplica uniones internas a dimensiones relacionadas.

El siguiente ejemplo muestra cómo las dimensiones relacionadas solo devuelven filas que están presentes en los datos. No hay estudiantes en la clase Llamadas de alarma 101, por lo que no está presente en los resultados. Cardinal y Jay no están en ninguna clase, por lo que no están presentes en los resultados.

Una visualización que muestra una unión interna de Clase y Estudiante, con dos filas para Finch (Canciones avanzadas, Conceptos básicos de anidación), dos filas para Robin (Vuelo para novatos, Conceptos básicos de anidación) y dos filas para Sparrow (Canciones avanzadas, Conceptos básicos de anidación)

Las dimensiones no relacionadas utilizan uniones cruzadas

Las dimensiones no relacionadas (por sí solas, sin una dimensión de anexo) se unen en cruz.

En una unión cruzada, cada valor de una dimensión se combina con cada valor de la otra dimensión, incluso si la combinación resultante no existe realmente en los datos. En este ejemplo, la unión cruzada agrega una fila para cada combinación posible de Clase y Club.

Una visualización que muestra una unión cruzada de Clase y Club con filas para cada combinación de Canciones avanzadas/Llamadas de alarma 101/Vuelo para novatos/Conceptos básicos de anidación con arte/Primeros auxilios/Malabarismo/Fotografía. Hay un icono no relacionado que se muestra en ambos campos de dimensión en el estante Filas.

Es importante reconocer cuándo se produce una unión cruzada en su análisis. Aunque hay una fila para Primeros auxilios + Canciones avanzadas en la tabla de resultados para la unión cruzada, en realidad no hay estudiantes en esta combinación de actividades (veremos la prueba de esto en el ejemplo de anexo en la siguiente sección).

¿Por qué es importante reconocer que no todos los resultados de combinaciones cruzadas se basan en los datos? Imagina que estás intentando crear un horario para clases y clubes para que no haya conflictos para ningún estudiante. No hay estudiantes en Canciones Avanzadas y Primeros Auxilios, por lo que puede ignorar este resultado y programar esa clase y club simultáneamente. La unión cruzada no representa combinaciones de valores que realmente existen en los datos.

Además, las uniones cruzadas cuando hay una cardinalidad alta (una gran cantidad de valores únicos) pueden afectar al rendimiento. Imagine unir todos los números de teléfono con todas las direcciones de correo electrónico de sus contactos. Eso supondría una enorme explosión de combinaciones y una operación potencialmente costosa.

Las dimensiones anexadas utilizan uniones externas

Las dimensiones no relacionadas (en presencia de una dimensión de anexo) se unen externamente.

En este ejemplo, tanto la tabla Clases como la tabla Clubes están relacionadas con la tabla Estudiantes compartida pero no entre sí, por lo que los campos Clase y Club no están relacionados. Agregar la dimensión Estudiante le permite a Tableau saber qué valores de Clase y qué valores de Club deben yuxtaponerse en el análisis. A esto lo llamamos anexo de comportamiento de unión externa.

Visualización que muestra los resultados de una unión externa de la unión interna Estudiante-Clase y la unión interna Estudiante-Club. Hay un icono no relacionado en los campos Clase y Club en el estante Filas. Hay un campo para Estudiante en la propiedad Color de la tarjeta Marcas y no tiene un icono no relacionado. No todas las combinaciones de clases y clubes están representadas, y hay filas para estudiantes y clubes sin clase.

Anexar es similar a la combinación de datos en el sentido de que hay resultados intermedios que se vuelven a unir para obtener los resultados generales. Sin embargo, a diferencia de la combinación, un anexo es una unión externa, no una unión izquierda, y no elimina valores de ninguno de los lados. No existe el concepto de fuentes de datos principales o secundarias cuando se trata de una sola fuente de datos, por lo que ambos campos no relacionados tienen la misma prioridad.

Los resultados intermedios están unidos exteriormente

¿Qué conlleva la unión externa de los campos anexados? Se calcula una unión interna inmediata para cada uno de los campos no relacionados y el campo anexado, luego esos resultados intermedios se unen externamente en función de los valores de la dimensión de anexo.

Ejemplo

Una unión interna para estudiantes y clases...

Una tabla de resultados para tres valores de estudiantes y tres valores de clases.

... y una unión interna para Estudiante y Club...

Una tabla de resultados para cuatro valores de estudiantes y cinco valores de clubes.

... luego se unen externamente en Estudiante.

Una tabla de resultados para cuatro valores de estudiantes, tres valores de clases y cinco valores de clubes.

Uniones adicionales para retener medidas

Además de la lógica de unión de dimensiones, las medidas pueden introducir uniones adicionales. Cuando las relaciones se introdujeron por primera vez en Tableau, uno de los los principios básicos era que los valores de las medidas no se pierden.. Esto también se mantiene en modelos de datos de relaciones multifactor.

Los detalles esenciales son:

  • Los valores de las medidas se desglosan únicamente por dimensiones relacionadas.
  • Los valores de medida se repiten para dimensiones no relacionadas.
  • Los valores de dimensión que se eliminarían en visualizaciones de solo dimensión se pueden devolver si hay valores de medida relevantes asociados con ellos.

Nota: Recuerde que las medidas son agregaciones: se calculan en el nivel de detalle (la granularidad) establecido por la combinación de dimensiones en la visualización. Esto se conoce como una medida desglosada por una dimensión. Cuando se utiliza una medida sin dimensiones, se dice que tiene un alcance de tabla. Esto significa que el valor de la medida es el valor completamente agregado. Tan pronto como utilizamos una dimensión en la visualización, la medida se desglosa de forma más detallada en función de los valores de la dimensión. Por tanto, el valor de una medida en un análisis depende del contexto de las dimensiones.

Medidas relacionadas

Considere el subconjunto de valores de dimensión que se devuelven para una unión interna en las dimensiones relacionadas EstudianteClase. Hay tres valores para Estudiante, Finch, Robin y Sparrow; y tres valores de clase: Canciones avanzadas, Conceptos básicos de anidación y Vuelo para novatos.

una tabla de resultados para una unión interna entre estudiante y clase

Si sumamos la medida Duración de la tabla Clase, vemos que se muestran las cuatro clases y hay un valor nulo para Estudiante. Cada clase Duración se muestra, al nivel de Clase.

Aparece un valor nulo para el estudiante aunque las dimensiones estén unidas internamente

Si en cambio añadimos la medida Edad de la tabla Estudiante, vemos que se muestran los cinco estudiantes y hay dos valores nulos para Clase. Los resultados preservan a todos los estudiantes, incluso si no están en una clase. La Edad de cada estudiante se muestra, al nivel de Estudiante.

Aparece un valor nulo para las clases aunque las dimensiones estén unidas internamente

Medidas no relacionadas

Los valores de medida se repiten para valores de dimensión no relacionados.

Si miramos la medida Duración de la tabla Clases y las dimensión no relacionada Club, la medida tiene un alcance de tabla y se repite en todos los valores de dimensión de Club.

una medida con alcance de tabla repetida en valores de dimensión no relacionados

En presencia de una dimensión de anexo, las medidas pueden dividirse y repetirse.

Aquí la medida Edad proviene de la tabla Estudiantes y se desglosa por nivel de estudiante. Cada vez que un estudiante se repite según las dimensiones para Clase y Club, el valor Edad se repite.

Solución de problemas

Consideraciones al trabajar con modelos de datos de relaciones multifactor

Filtros de extracción por tabla

Todos los filtros de extracción para un modelo de datos de relación multivariante son por tabla (no generalizados). Debido a esto, los resultados del filtrado pueden ser diferentes entre la conexión en tiempo real y de extracción.

Cálculos a nivel de fila

Los cálculos a nivel de fila solo pueden hacer referencia a campos que comparten la misma tabla base ascendente. Es decir, los cálculos a nivel de fila no se pueden realizar entre árboles.

Campos combinados

Todos los campos de un campo combinado deben compartir una tabla ascendente. Es decir, no se puede crear un campo combinado utilizando campos que se encuentran en árboles diferentes.

Conjuntos

Los conjuntos solo se pueden crear con una definición que incluya campos que compartan la misma tabla base ascendente. Sin embargo, en una visualización, la opción Agregar al conjunto puede estar disponible desde una marca cuando esa marca está definida por campos no relacionados con los campos utilizados para definir el conjunto. Si elige Agregar al conjunto, Tableau agregará solo los campos relacionados a la definición del conjunto. Esto es diferente del comportamiento de Agregar al conjunto en fuentes de datos de tabla base única, cuando Agregar al conjunto agrega todo lo que define la marca.

Validar expresiones de nivel de detalle INCLUDE

Las expresiones LOD INCLUDE no se pueden evaluar en campos no relacionados. Debido a que la relación entre campos se evalúa hoja por hoja, es posible tener una expresión LOD válida en el panel Datos o en el editor de cálculos que deje de ser válida en el contexto de una visualización específica (en presencia de una dimensión no relacionada). Cuando esto sucede, el campo LOD se pondrá rojo. Puede actualizar la expresión LOD para eliminar conflictos de campos no relacionados, cambiar la estructura de la visualización o eliminar la expresión LOD de la visualización.

Actualizar fuentes de datos publicadas

Como práctica recomendada, cree una copia de una fuente de datos publicada existente si planea modificarla para convertirla en un modelo de datos de relación multifactor cuando no todos sus libros conectados necesiten el nuevo modelo de datos. No actualice la versión existente de la fuente de datos a menos que todos sus libros necesiten las nuevas tablas. Publique la fuente de datos modificada como una nueva fuente de datos y cree nuevos libros a partir de ella. Esto evitará que los libros existentes se conviertan para usar VDS en lugar de un servidor de datos cuando no necesiten la funcionalidad, lo que evitará la posibilidad de que se vea afectado el rendimiento.

Problemas resueltos

Problema resueltoArreglado a partir de

Extractos

Fuente de datos local (en un libro de trabajo): si intenta extraer una fuente de datos de relación multifactor, aparecerá el error "No existe la tabla".

Fuente de datos publicada: la extracción de una fuente de datos de relaciones multifactor publicada parece tener éxito, pero los valores de los campos se pueden intercambiar.

  • Tableau Cloud: Resuelto a partir de las actualizaciones de mediados de julio. Esto también se aplica a public.tableau.com.
  • Tableau Desktop: Resuelto a partir de la versión de mantenimiento 2024.2.1 lanzada el 24 de julio de 2024
  • Tableau Server: Resuelto a partir de la versión de mantenimiento 2024.2.1 lanzada el 24 de julio de 2024

Si aún ve estos problemas en Tableau Desktop o Tableau Server, actualice a una versión del 24 de julio de 2024 o posterior.

Expresiones de nivel de detalle EXCLUDE

Solo se deben validar LOD INCLUDE en presencia de campos no relacionados. Sin embargo, las LOD EXCLUDE también pueden marcarse incorrectamente como no válidas en las mismas condiciones.

Cálculos de usuario anidados

Los cálculos de usuario anidados no están disponibles en fuentes de datos publicadas con un modelo de datos de relaciones multifactor.

Problemas conocidos en 2024.2

Indicadores de relación con múltiples tarjetas Marcas

Cuando se crea una visualización con varias medidas en el estante Filas o en el estante Columnas, cada medida obtiene su propia tarjeta Marcas. Es posible que la lógica utilizada para determinar los indicadores de relación (el icono no relacionado, el texto en la descripción emergente y el cuadro de diálogo de advertencia de relación) no proporcione los resultados esperados dependiendo de qué tarjeta Marcas esté abierta. Sin embargo, la visualización en sí se calcula correctamente en función de la relación de cada par de campos. Hay una solución planificada para este comportamiento.

BatchQueryProcessor

BatchQueryProcessor debe estar habilitado para admitir modelos de datos de relaciones multifactor. Este es un comportamiento esperado y no se ha planificado ninguna solución actualmente.

Tableau Pulse

Es posible que Pulse no funcione con modelos de datos de relaciones multifactor. Es posible que se le impida crear una definición de métrica o que cualquier métrica que se cree esté en blanco. Este no es un comportamiento esperado, pero todavía no hay ninguna solución planificada.

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!