Las relaciones no deben asustarle
Las nuevas funcionalidades de modelado de datos crean fuentes de datos flexibles basadas en relaciones.
Las relaciones combinan datos de tablas diferentes examinando qué columnas (campos) tienen en común esas tablas y usando esa información para reunir información de cada tabla en el análisis.
A diferencia de las uniones de filas o columnas, las relaciones forman una fuente de datos sin acoplar varias tablas en una sola tabla. Por esto, las fuentes de datos relacionadas saben de qué tabla procede cada campo. Esto significa que cada campo mantiene su contexto o nivel de detalle. Por lo tanto, las fuentes de datos relacionadas pueden controlar tablas con granularidad diferente sin problemas de duplicación o pérdida de datos.
En una fuente de datos relacionada, las uniones no se ajustan por adelantado. En lugar de combinar todos los datos (y tener que trabajar con todos los datos independientemente de lo que requiera cada visualización), solo se combinan los datos relevantes, por hoja y según sea necesario. A medida que arrastra y suelta, Tableau evalúa las relaciones de los campos y tablas relevantes. Estas relaciones se usan para escribir consultas con los tipos correctos de combinación, agregaciones y control de valores nulos.
Puede pensar en cómo encajan los datos y qué preguntas desea responder, en lugar de cómo combinar los datos o compensar los artefactos de la fuente de datos.
Las relaciones no reemplazan las formas anteriores de combinar datos: uniones de filas, uniones de columnas y combinaciones. Más bien, las relaciones son una forma nueva y flexible de reunir datos de varias fuentes. Los métodos existentes no desaparecen y siguen siendo útiles en escenarios específicos.
Nota: Para obtener información relacionada con el modo en el que funcionan las consultas de relaciones, consulte estas publicaciones del blog de Tableau:
- Relaciones, parte 1: introducción al nuevo modelado de datos en Tableau(El enlace se abre en una ventana nueva)
- Relaciones, parte 2: consejos y trucos(El enlace se abre en una ventana nueva)
- Relaciones, parte 3: hacer preguntas en varias tablas relacionadas(El enlace se abre en una ventana nueva)
Vea también podcasts de vídeo sobre relaciones de Action Analytics(El enlace se abre en una ventana nueva), como Why did Tableau Invent Relationships?(El enlace se abre en una ventana nueva) Haga clic en "Video Podcast" en Library(El enlace se abre en una ventana nueva) para ver más.
Usar relaciones
En este tema se describe la creación de una fuente de datos relacionada cómo usar una para el análisis. Si desea seguir, puede descargar el conjunto de datos de Librería(El enlace se abre en una ventana nueva). Seleccione Bookshop.xlsx para que los datos sin procesar comiencen desde cero o MinimalBookshop.tdsx para empezar con los conceptos básicos de una fuente de datos relacionada configurada para usted.
Nota: Las relaciones se pueden utilizar en Tableau 2020.2 y versiones posteriores.
Vídeo: Datos migrados
Si abre un libro de trabajo existente desde la versión 2020.1 o anteriores de Tableau en Tableau 2020.2 o posteriores, la pestaña de la fuente de datos podría mostrar una tabla Datos migrados.
Si abre un libro de trabajo creado antes de que las relaciones estuvieran disponibles (antes de la versión 2020.2), la fuente de datos puede tener un aspecto diferente. Si había tablas con uniones de filas o columnas, aparecerán como una única tabla lógica denominada Datos migrados. Haga doble clic para ver las tablas subyacentes: siguen ahí y el análisis se comportará según lo esperado.
Tenga en cuenta que cuando solo utiliza la tabla Datos migrados, el panel Datos se comporta igual que en las versiones anteriores de Tableau Desktop.
Incluso puede relacionar nuevas tablas con la tabla Datos migrados directamente para ampliar el modelo de datos.
Una vez que haya agregado relaciones al modelo de datos, el panel Datos se actualiza al nuevo diseño, con dimensiones y medidas mantenidas dentro de cada tabla, y la tabla Datos migrados se muestra como una única tabla combinada.
Vídeo: Relacionar tablas
Nota: la interfaz para editar relaciones que se muestra en este vídeo difiere ligeramente de la versión actual, pero tiene la misma funcionalidad.
Para crear una fuente de datos de tablas relacionadas, conéctese a los datos y arrastre una tabla al lienzo. Arrastre una segunda tabla. Si se puede, se formará una relación automáticamente. Si Tableau no puede detectar los campos relacionados, se le pedirá que los seleccione usted mismo.
El lienzo que está viendo es una nueva capa del modelo de datos donde puede relacionar tablas juntas. Al arrastrar tablas adicionales, se agregan al modelo de datos. Los hilos muestran qué tablas están relacionadas.
Las relaciones pueden formarse en función de los campos calculados. También puede especificar cómo se deben comparar los campos mediante operadores al definir la relación.
Agregar uniones de columnas
Puede crear una unión de columnas haciendo doble clic en una tabla para abrir el lienzo de unión (también denominado capa física) y, a continuación, arrastrando una tabla para crear una unión. La creación de uniones de columnas es la misma que en las versiones anteriores de Tableau: puede establecer una cláusula de unión, incluido un cálculo si es necesario, y configurar el tipo de unión.
Una vez que se cierra el lienzo de unión, la tabla en el lienzo de relación (también denominada capa lógica) tiene un icono de unión para indicar la unión subyacente. Esto se debe a que una unión de columnas fusiona sus tablas para formar una tabla nueva. Las tablas relacionadas siguen siendo independientes.
Agregar uniones de filas
Agregue uniones de filas arrastrando Nueva unión de filas. Las uniones de filas, al igual que las uniones de columnas, fusionan los datos y muestran un icono en la capa lógica. Recomendamos cambiar siempre el nombre de las uniones de filas (o de cualquier tabla con nombres poco claros) a otro más práctico.
Vídeo: Opciones de rendimiento
Nota: la interfaz para editar relaciones que se muestra en este vídeo difiere ligeramente de la versión actual, pero tiene la misma funcionalidad.
Para cualquier relación, hay opciones de rendimiento, así como campos relacionados. Tableau elige automáticamente valores predeterminados seguros para estas opciones. Sin embargo, si está seguro de las características de los datos, cambiar estas opciones puede proporcionar a Tableau más información sobre cómo configurar mejor las uniones automáticas durante el análisis. Establecer las opciones de cardinalidad e integridad referencial proporciona a Tableau más información sobre cómo optimizar las consultas.
Cardinalidad
La cardinalidad indica si los registros de campo de vinculación son únicos o no. Si varios libros pueden tener el mismo autor, pero cada autor aparece una sola vez en la tabla de autor, la cardinalidad de AuthID sería Varios para libros y Uno para autor entre esas dos tablas. Esta configuración afecta a la forma en que Tableau gestiona la agregación antes o después de la unión.
Integridad referencial
La integridad referencial indica si se garantiza o no que un registro de una tabla tenga una relación en otra tabla. Si cada libro tiene un autor, Libro tiene integridad referencial para Autor. Si no todos los autores tienen un libro, el autor no tiene integridad referencial para Libro. Esta configuración afecta a la forma en que Tableau elige un tipo de unión y gestiona los registros no coincidentes.
Para obtener más información, consulte Cardinalidad e integridad referencial.
Ejemplo: Datos de librería
Haremos un análisis con esta fuente de datos en un momento, hablemos primero un poco de los datos.
El conjunto de datos trata libros (ficticios) y es importante tener en cuenta la distinción entre un libro y una edición. Un libro es la obra conceptual en sí, con atributos como el título, el autor y el género. También hay ediciones de un libro, con atributos como un precio y un formato (tapa dura o tapa blanda), que se identifican con un ISBN. Una edición de un libro tiene un editor y un recuento de páginas, mientras que un libro puede haber ganado un premio o pertenecer a una serie.
Puede seguir estas instrucciones descargando MinimalBookshop.tdsx, o construir el modelo usted mismo con el archivo Bookshop.xlsx. Tenga en cuenta que puede ocultar muchos de los campos de ID una vez que se combinan las tablas.
Vídeo: Trabajar con varias tablas
Nota: la interfaz para editar relaciones que se muestra en este vídeo difiere ligeramente de la versión actual, pero tiene la misma funcionalidad.
La página Fuente de datos
Antes de ir a la pestaña de una hoja, observe que la vista de cuadrícula de datos, a continuación, muestra solo los campos de una tabla cada vez. Si hacemos clic en otra tabla, veremos los datos que contiene. No hay una vista general porque los datos relacionados no se agrupan hasta que se usan en un análisis. Por ahora, los datos permanecen en cada tabla y, por lo tanto, se muestran por tabla.
Si hacemos clic en una tabla con una unión de filas o columnas subyacente, vemos que los datos combinados, con los valores NULL que puedan implicar.
El panel Datos
Al hacer clic en una hoja, puede observar que el panel Datos tiene un aspecto diferente al de las versiones anteriores de Tableau. En lugar de la organización principal de dimensiones y medidas, ahora se centra en las tablas. Cada tabla tiene su propio desglose para dimensiones y medidas, indicado por esta línea. Es posible seguir agrupando por carpetas en su lugar, si lo desea.
Número de registros y recuento
Tampoco hay ningún campo Número de registros. Esto se debe a que el concepto de Número de registros ha cambiado. No hay un solo número de registros para la fuente de datos. Cada tabla tiene un campo Recuento, que se puede considerar como un número local de registros para esa tabla.
Para tener una idea del número de registros para varias tablas al mismo tiempo, puede usar Nombres de medida y Valores de medida o seleccionar varios campos de recuento y usar Mostrarme para crear una visualización.
Vídeo: Cálculos básicos
Hay algunos cálculos que podemos hacer para que este conjunto de datos sea un poco más fácil de usar. En primer lugar, podemos crear un cálculo para el nombre completo del autor que reúne el nombre y el apellido. Crearemos un cálculo llamado Nombre del autor que es simplemente el nombre, un espacio y el apellido. Tenga en cuenta que este cálculo permanece en la tabla Autor porque utiliza campos solo de esa tabla.
[First Name] + " " + [Last Name]
Cuando realizamos una venta, el importe de venta es una combinación del precio (fijado por el editor y específico de la edición o el ISBN) y cualquier descuento en el momento de la venta. Así que el cálculo Importe de ventas será el precio por uno menos el descuento. Tenga en cuenta que estamos usando la función ZN (o Zero Null) para gestionar las ventas sin descuentos para que no obtengamos valores nulos. Este cálculo va al área compartida en la parte inferior del panel Datos, ya que usa campos de varias tablas. Los cálculos agregados también irán a la parte inferior del panel Datos.
[Price] * (1-ZN([Discount]))
Vídeo: Conjuntos y grupos
Crearemos un conjunto para que los libros identifiquen si pertenecen a una serie. En el tabla Libro, haga clic con el botón derecho en Título y seleccione Crear > Conjunto. Lo llamaremos De una serie. En la pestaña Condición, seleccione Por campo con Nombre de serie, Recuento, como >= 1.
En la tabla Edición, el campo Formato es bastante detallado, incluye datos de la versión de tapa blanda comercial. A veces ese detalle es útil, pero a veces queremos generalizar entre tapa dura y tapa blanda. Haga clic con el botón derecho en el campo Formato en el panel Datos y seleccione Crear > Grupo. Lo llamaremos Cubierta. Pulse Control y haga clic para seleccionar todo excepto Tapa dura y, a continuación, haga clic en Agrupar. El nombre del grupo se resalta automáticamente y podemos llamarlo Tapa blanda.
Al igual que con el cálculo de nombre de autor, estos elementos que acabamos de crear son relevantes dentro de una sola tabla y, por lo tanto, permanecen dentro de esas tablas en el panel Datos.
Analizar datos relacionados
Vamos a hacer algunas comparaciones del aspecto del análisis entre las relaciones y las uniones. Le recomendamos que descargue los libros de trabajo complementarios para la pregunta 1 y la pregunta 2 que aparecen arriba en lugar de continuar con su propia fuente de datos. Si identifica problemas con la configuración de la fuente de datos o los pasos de la pregunta 1, tenga en cuenta que son intencionales para este caso.
Pregunta 1: ¿Cuántas ediciones hay para cada libro?
Importante: El vídeo de la pregunta 1 se grabó en la versión beta del software. La versión 2020.2 gestiona correctamente nuestro intento de introducir un error en la fuente de datos relacionada. Si sigue estos pasos, su libro de trabajo no coincidirá con el vídeo: los valores de las relaciones serán correctos. Tenga paciencia, intentaremos burlar nuestro producto y forzar un error con fines educativos.
Lo configuraremos haciendo un análisis básico con ambas fuentes de datos. Crearemos un gráfico de barras con cada una, analizando el número de ediciones por título.
Relacionada | Unida |
Utilizar la fuente de datos relacionada:
| Usar la fuente de datos unida:
|
Está claro inmediatamente que Recuento no es la agregación correcta para los datos unidos. Sin embargo, algo anda mal con los datos relacionados. Veamos los datos y veamos qué está pasando y cómo solucionarlo. Vea el vídeo (o lea su transcripción) para ver cómo.
Vídeo: Validar datos y ajustar del modelo de datos
Unida
Aquí estamos viendo nuestros datos unidos. En la visualización unida, echaremos un vistazo a los datos subyacentes de una marca.
Este cuadro de diálogo de datos de vista tiene dos pestañas, Resumen y Datos completos.
- Hay muchísimas de filas para el mismo libro, esto probablemente se duplica debido a todas las uniones.
Para controlar la duplicación, cambiaremos la agregación en el campo ISBN de la vista a Conteo definido. Recuerde que tendremos que tener en cuenta esta duplicación en casi todos los escenarios analíticos y abordarla con la agregación, el filtrado o la forma en la que estructuramos la visualización.
Relacionada
Echemos un vistazo a la estructura de nuestra fuente de datos relacionada y a lo que está pasando con nuestra unión también. En la visualización relacionada, veremos los datos subyacentes de una marca.
Aquí vemos que el cuadro de diálogo de datos de vista tiene dos pestañas, pero esta vez es la pestaña Edición en lugar de Datos completos. Cada tabla utilizada en la visualización tendrá su propia pestaña.
- Hay una duplicación de filas en este libro, ya sabemos que las uniones pueden generar duplicaciones, y que la tabla Libro de esta fuente de datos es realmente la tabla Libro unida a Info y Premio.
Podemos crear una visualización con Título y Nombre del premio y desplazarnos hacia abajo para investigar un poco más. Aquí vemos que The Mallemaroking ha ganado dos premios. Sería mejor relacionar estas tablas que unirlas.
Volveremos a la pestaña Fuente de datos y eliminaremos la tabla Premios de la unión y la relacionaremos. Ahora ya no tenemos que preocuparnos por el problema de duplicación en esta fuente de datos.
Pregunta 2: Para autores con libros de una serie o saga, ¿quién tiene más eventos de gira de libros?
Vídeo: Trabajar con diferentes niveles de detalles
Veamos con qué autores trabajaremos. Con la fuente de datos relacionada, llevaremos Nombre de autor y Nombre de serie a Filas.
Dado que las fuentes de datos relacionadas reducen los datos no coincidentes en tablas que solo contienen dimensiones, nos centramos en los datos que son relevantes para nosotros. Podemos ver que hay siete autores, dos de los cuales han escrito para dos series. Si no desea ver solo los valores coincidentes, puede restaurar esos valores no coincidentes (que se parece más al comportamiento heredado) desde el menú Análisis > Diseño de tabla y marcando Mostrar filas vacías.
Relacionada | Unida |
Utilizar la fuente de datos relacionada:
| Usar la fuente de datos unida:
Nuestros números no parecen los correctos. |
Para los datos unidos, sabemos que hay una duplicación debida a la unión y también sabemos que algunos autores abarcan diferentes series. Debido a esto, no podemos simplemente cambiar la agregación a, por ejemplo, MIN o MAX, porque perderíamos información para los autores con obras en varias series.
Lo que realmente queremos es el número de eventos por serie, visualizados por autor. Este es un caso clásico para expresiones de nivel de detalle (LOD). Crearemos un cálculo Eventos de serie:
{FIXED [Series Name] : MIN ([Book Tour Events])}
Tenga en cuenta que MIN debe controlar la duplicación de eventos para una sola serie.
Ahora, si llevamos este nuevo campo a Columnas en lugar del campo de eventos original, obtendremos los valores correctos.
Para los datos relacionados, no necesitábamos hacer nada de eso. Las relaciones son lo suficientemente inteligentes como para comprender el nivel de detalle nativo y la forma en que la tabla Autor se relaciona a través de las tablas Libro e Info a través de la tabla Series, y para unir y agregar correctamente la medida Eventos al Nombre del autor, todo ello sin tener que escribir cálculos de nivel de detalle.
Así que no tenga miedo de relacionar sus datos. Pruébalo. Puede descargar los datos de Librería(El enlace se abre en una ventana nueva) o utilizar algunos de los suyos. Intente filtrar, usar cálculos de tablas, crear una variedad de tipos de gráficos, configurar opciones de rendimiento e insertar relaciones en la medida de lo posible.
Consejos para trabajar con datos relacionados
- Ver datos subyacentes a menudo para comprobar qué datos representa una marca.
- Si no necesita crear una unión, aunque hay razones por las que podría necesitarlo, usar una relación le dará una mayor flexibilidad.
- Si no desea ver solo los valores coincidentes, puede restaurar esos valores no coincidentes en el menú Análisis > Diseño de tabla > Mostrar filas vacías.
Recursos relacionados
¿Listo para abordar los cálculos con las relaciones? Consulte Los cálculos en las relaciones no deben asustarle.
¿Quiere seguir explorando cómo hacer análisis complejos con relaciones? Consulte Las relaciones más profundas no deben asustarle.
Para obtener más información sobre los fundamentos técnicos de las relaciones directamente de la mano del equipo de gestión de productos, consulte la serie sobre relaciones en el blog de Tableau.
- Relaciones, parte 1: introducción al nuevo modelado de datos en Tableau(El enlace se abre en una ventana nueva)
- Relaciones, parte 2: consejos y trucos(El enlace se abre en una ventana nueva)
- Relaciones, parte 3: hacer preguntas en varias tablas relacionadas(El enlace se abre en una ventana nueva)
Vea también podcasts de vídeo sobre relaciones de Action Analytics(El enlace se abre en una ventana nueva), como Why did Tableau Invent Relationships?(El enlace se abre en una ventana nueva) Haga clic en "Video Podcast" en Library(El enlace se abre en una ventana nueva) para ver más.