Planificar la fuente de datos
En el centro de Tableau se encuentran sus datos. El éxito a la hora de explorar datos, responder preguntas y crear visualizaciones para que usted u otros puedan usarlas dependen de los datos subyacentes.
Si su objetivo es hacer una exploración rápida o análisis ad hoc, es posible que pueda entrar, conectarse a algunos datos, arrastrar y soltar contenido para construir algunas visualizaciones y extraer la información que necesita. Pero si su objetivo es crear un análisis o fuente de datos que se usará más de una vez, es mejor pensar y planificar en profundidad la fuente de datos.
Fuentes de datos de Tableau
Las fuentes de datos de Tableau representan el vínculo entre sus datos originales y Tableau. Es, básicamente, la suma de sus datos (ya sea como una conexión en tiempo real o como una extracción), la información de las conexiones, los nombres de las tablas u hojas que contengan datos y las personalizaciones que les aplique para trabajar con ellos en Tableau. Esas personalizaciones incluyen aspectos como la forma en que se combinan los datos y metadatos como cálculos, campos renombrados y formatos predeterminados.
Una fuente de datos de Tableau puede contener varias conexiones de datos a diferentes bases de datos o archivos. La información de conexión incluye dónde se encuentran los datos, como un nombre de archivo y una ruta de acceso o una ubicación de red y detalles sobre cómo conectarse a los datos, como el nombre del servidor de base de datos y la información de inicio de sesión del servidor.
Nota: Los términos fuente de datos y conexión de datos se han utilizado indiscriminadamente en el pasado y pueden carecer de una distinción clara en los materiales más antiguos.
También es importante tener en cuenta la diferencia entre la fuente de datos de Tableau (el acceso de Tableau a los datos y todas las personalizaciones que pueden estar implicadas) y los datos de origen en sí (como una base de datos o una hoja de cálculo de Excel). La planificación de una fuente de datos en el sentido de diseñar una base de datos no entra dentro del alcance de este tema.
Las fuentes de datos de Tableau pueden permanecer insertadas en el libro de trabajo donde se crearon originalmente o se pueden publicar por separado. Las fuentes de datos publicadas permiten centralizar y adaptar las fuentes de datos procesadas. Consulte Prácticas recomendadas para fuentes de datos publicadas para obtener más información.
Combinar datos
Si los datos proceden de una tabla, puede conectarse a ellos, arrastrar una tabla al lienzo para crear la fuente de datos y, luego, empezar a crear la vista. Pero si los datos se distribuyen entre varias tablas, o entre varias bases de datos, deberá combinarlos. La combinación de datos se produce en la página de la fuente de datos.
Base de datos única | Varias bases de datos |
|
|
Nota: Para relacionar tablas entre diferentes bases de datos, deben agregarse como conexiones de datos dentro de la misma fuente de datos, no como una nueva fuente de datos. Las conexiones de datos se agregan desde el vínculo Agregar del panel izquierdo. Se pueden crear nuevas fuentes de datos desde el menú Datos o el menú desplegable del icono situado junto al nombre de la fuente de datos, como se muestra en la imagen siguiente.
Métodos de combinación de datos
Las relaciones son la forma predeterminada de combinar los datos en Tableau. Las relaciones son una forma dinámica y flexible de combinar datos de varias tablas para su análisis. Si es necesario, las tablas también se pueden unir mediante uniones de filas o columnas. Las fuentes de datos también se pueden combinar. Echemos un vistazo a las opciones de cómo se pueden combinar los datos en Tableau y algunas de las situaciones en las que cada método es útil.
Relaciones | Establezca la posibilidad de uniones entre dos tablas en función de campos relacionados. No combina datos para crear una nueva tabla fija. Durante el análisis, consulta las tablas relevantes automáticamente mediante uniones contextualmente adecuadas para generar una tabla de datos personalizada para ese análisis. Mantiene el nivel de detalle adecuado, no pierde datos, mantiene las agregaciones adecuadas y controla los valores nulos. |
Uniones | Combine dos tablas de datos basadas en una cláusula de unión y un tipo de unión para formar una nueva tabla fija de datos. A menudo se utiliza para agregar nuevas columnas de datos a través de la misma estructura de fila básica. Puede provocar la pérdida de datos con algunos tipos de unión si los campos no están presentes en todas las tablas. Puede provocar la duplicación de datos si las tablas tienen diferentes niveles de detalle. |
Uniones de filas | Combine dos o más tablas de datos para formar una nueva tabla fija de datos. Se utiliza para anexar, es decir, agregar nuevas filas de datos a través de la misma estructura de columna básica. |
Combinaciones | Trabaje en dos o más fuentes de datos de Tableau independientes. Los datos permanecen separados. Tableau consulta las fuentes de datos de forma independiente y visualiza los resultados juntos en la vista, en función de los campos de vinculación establecidos para esa hoja. Imita el comportamiento de una unión a izquierdas y puede filtrar datos de fuentes de datos secundarias. |
Nota: También es posible combinar datos con SQL personalizado. La mayoría de las veces, es mejor combinar datos directamente en el lienzo o con la combinación de datos. Esto otorga a Tableau una mayor flexibilidad para la optimización. Sin embargo, en ciertos casos, puede haber razones para usar SQL personalizado. Tenga en cuenta que hacerlo puede afectar al rendimiento porque Tableau se ve obligado a ejecutar la instrucción del SQL personalizado tal como está escrita.
Relaciones
Relacionar es un método para trabajar con datos de varias tablas basadas en campos compartidos (columnas) entre esas tablas. Al establecer una relación se informa a Tableau de cómo se pueden conectar las filas entre tablas. Tableau contiene esa información, pero no reúne inmediatamente las filas, igual que sucede con una unión codificada. En su lugar, cuando se crea una visualización, los campos implicados en el análisis se rastrean a través de la relación y las uniones adecuadas se crean para devolver los datos correspondientes.
Dado que los datos nunca se integran forzosamente en una sola tabla fuera del contexto de una visualización, las relaciones son útiles cuando los datos están en diferentes niveles de detalle o granularidad. Por ejemplo, si necesita trabajar con datos sobre lluvias diarias en una tabla, pero temperaturas por hora en otra.
Para obtener más información sobre cómo combinar tablas usando relaciones, consulte Relacione sus datos.
Para obtener más información acerca de cómo combinar tablas mediante relaciones, consulte Relacione sus datos y estas publicaciones del blog de Tableau:
- Relaciones, parte 1: introducción al nuevo modelado de datos en Tableau(El enlace se abre en una ventana nueva)
- Relaciones, parte 2: consejos y trucos(El enlace se abre en una ventana nueva)
- Relaciones, parte 3: hacer preguntas en varias tablas relacionadas(El enlace se abre en una ventana nueva)
Nota: En la versión 2024.2 de Tableau y posteriores, el modelo de datos de Tableau admite análisis multivariante y dimensiones compartidas a través de relaciones multifactor. Para obtener más información, consulte Acerca de los modelos de datos de relaciones multifactor(El enlace se abre en una ventana nueva), Cuándo utilizar un modelo de relación multifactor(El enlace se abre en una ventana nueva), y Construir un modelo de datos de relaciones multifactor(El enlace se abre en una ventana nueva).
Unión de columnas
La unión de columnas es un método que sirve para combinar tablas relacionadas por campos comunes (es decir, columnas comunes). El resultado de combinar los datos usando una combinación es una tabla que se extiende horizontalmente añadiendo columnas de datos.
Para obtener más información sobre cómo combinar datos en Tableau, consulte Combinar datos.
Combinación de datos
Al utilizar la combinación de datos para combinar sus datos, lo hace en lo que se denomina "fuente de datos primaria" con campos comunes de una o varias fuentes de datos secundarias.
La combinación de datos es útil cuando necesita cambiar la forma en que se configura la fuente de datos hoja por hoja o cuando desea combinar bases de datos que no permiten relaciones o uniones, como fuentes de datos multidimensionales o publicadas.
El resultado de combinar los datos usando una combinación de datos es una tabla virtual que se extiende horizontalmente añadiendo columnas de datos. Los datos de cada fuente de datos se agregarán a un nivel común antes de mostrarse juntos en la visualización.
Para obtener más información sobre el funcionamiento de la combinación de datos y sobre cómo combinar los datos en Tableau, consulte Combinar datos.
Unión de filas
La unión de filas es un método que sirve para añadir valores (filas) a las tablas. Puede unir tablas si tienen las mismas columnas. El resultado de combinar los datos usando una unión es una tabla virtual que tiene las mismas columnas, pero que se extiende verticalmente añadiendo filas de datos.
Puede unir tablas de dos maneras: manualmente o mediante la búsqueda con comodines. Para obtener más información sobre cómo unir datos siguiendo uno de estos métodos en Tableau, consulte Unir los datos.
Premisas importantes de una fuente de datos de Tableau
Antes de cualquier otra cosa, asegúrese de que tiene claro el propósito de la fuente de datos. Si va a crear una fuente de datos global para una amplia variedad de usuarios con preguntas amplias, debe hacerlo de forma diferente a la que usaría para crear una fuente de datos centralizada y optimizada para conseguir un rendimiento idóneo. Es importante conocer el objetivo de la fuente de datos desde el principio.
Con ese objetivo en mente, hay varios elementos que debe tener en cuenta y planificar antes de crear una fuente de datos en Tableau:
- Ubicación y acceso
- Forma y limpieza
- El modelo de datos y la combinación de datos
- Metadatos y personalización
- Adaptación, seguridad y capacidad de detección
- Rendimiento y actualizaciones
Ubicación y acceso
La ubicación de sus datos puede ser tan simple como un único archivo de Excel en su equipo o una hoja de cálculo de Google que ha creado, o tan compleja como varias bases de datos utilizando tecnologías diferentes. El acceso también puede implicar controladores o conectores específicos para una base de datos o información de inicio de sesión para un servidor de base de datos.
Cuestiones que se deben tener en cuenta:
- ¿Los usuarios adecuados de Tableau tienen acceso y permisos a los datos y a Tableau?
- ¿Qué cuenta de usuario se debe usar para iniciar sesión en la base de datos?
- ¿Se necesitará el filtrado de usuarios o la seguridad a nivel de fila?
- ¿Los datos de origen se almacenan de forma local o en la nube?
- Esto puede tener importancia si los datos se publican en Tableau Cloud.
- ¿Hay Conectores compatibles?
- ¿Hay alguna limitación para esa base de datos (admite todas las funcionalidades que espera utilizar)?
Forma y limpieza
Es posible que su organización ya tenga datos bien estructurados a los que pueda conectarse o procesos ETL que pueda aprovechar, o que necesite utilizar Tableau Prep Builder para realizar operaciones de limpieza y modelado para obtener sus datos en un formato útil.
Cuestiones que se deben tener en cuenta:
- ¿Los datos están bien estructurados para su uso con Tableau?
- ¿Deberían usarse Tableau Prep Builder y Tableau Prep Conductor para limpiar y automatizar los flujos de preparación de datos?
- ¿Qué cálculos o manipulaciones se harían mejor de forma nativa en Tableau?
- ¿Alguno de estos datos es innecesario? ¿Falta algún dato?
El modelo de datos y la combinación de datos
Tableau necesita saber cómo consultar los datos, que se establece en el El modelo de datos de Tableau. Si los datos proceden de varias tablas, los datos deben combinarse. Los métodos de combinación de datos incluyen las relaciones, las uniones de filas o columnas y las combinaciones.
Cuestiones que se deben tener en cuenta:
- ¿Los datos están repartidos en varios sistemas?
- ¿Cuál es la mejor manera de combinar cada tabla de datos?
Metadatos y personalización
Los datos a menudo se almacenan de una manera que no es fácil de usar para una persona cómodamente. Por ejemplo, los nombres de campo predeterminados pueden ser difíciles de controlar, es posible que se quiera usar el formato personalizado, que falten definiciones de abreviaturas o códigos o que los cálculos comunes no estén presentes en los datos subyacentes. Crear una capa semántica con esa información puede hacer que los datos sean mucho más fáciles de entender y usar.
Cuestiones que se deben tener en cuenta:
- ¿Qué cálculos se deben agregar?
- ¿Son comprensibles los nombres de tabla y campo?
- ¿Es útil la configuración predeterminada de los campos o se debe personalizar?
- ¿Hay algún ajuste que se deba realizar para admitir Tableau Catalog?
Tenga en cuenta que Explique los datos no admite fuentes de datos de varias tablas en este momento.
Adaptación, seguridad y capacidad de detección
Una fuente de datos puede permanecer en el libro de trabajo donde se creó (una fuente de datos insertada) o puede publicarse en Tableau Server o Tableau Cloud independientemente de cualquier análisis como un recurso de contenido propio. Esta centralización de fuentes de datos publicadas tiene la ventaja añadida de su seguridad y capacidad de adaptación, lo que permite a varios usuarios acceder a una fuente de datos coherente. Las fuentes de datos publicadas también pueden aprovechar Tableau Catalog y las recomendaciones y proporcionar una única fuente de información verídica para una organización.
Cuestiones que se deben tener en cuenta:
- ¿Debe la fuente de datos permanecer insertada en el libro de trabajo?
(Las siguientes preguntas suponen que se publica la fuente de datos)
- ¿Dónde se publicará la fuente de datos?
- ¿Quién será el propietario de la fuente de datos?
- ¿Qué autenticación y permisos debe tener?
- ¿Se certificará?
Rendimiento y actualizaciones
Además, las fuentes de datos de Tableau pueden ser conexiones en tiempo real a los datos de origen o los datos se pueden copiar como una extracción actualizable. Las extracciones pueden aumentar el rendimiento del análisis o evitar la fuga de recursos en los sistemas de base de datos.
Cuestiones que se deben tener en cuenta:
- ¿Debe la conexión de datos ser en tiempo real o una extracción?
- Si se extrae, ¿habrá un programa de actualización? (Tableau Server | Tableau Cloud)
- Si se publica en Tableau Cloud, ¿deberá utilizarse Tableau Bridge?
Crear fuentes de datos de calidad
Hay muchos factores para crear una fuente de datos bien diseñada y con un rendimiento óptimo. Sin embargo, no tiene por qué publicar su primer intento. Al igual que crear una buena visualización, crear una fuente de datos puede ser un proceso continuo. Pruebe a combinar los datos que cree que necesita y luego ver si se puede construir la visualización que desea. Siempre puede volver atrás y escribir un nuevo cálculo o usar otra tabla de datos. Haga algunas pruebas con usuarios y pregunte a un colega si pueden averiguar sus nombres de campo.
Por supuesto, es mejor publicar únicamente las fuentes de datos en las que confía y solo certificar las que han superado los procesos de garantía de calidad. En el momento en que la fuente de datos está delante de los usuarios, deben poder confiar en ella.