Tableau Data Management

Este contenido es parte de Tableau Blueprint, un marco de madurez que le permite ampliar y mejorar la forma en que su organización utiliza los datos para generar impacto. Para comenzar su recorrido, complete nuestra evaluación(El enlace se abre en una ventana nueva).

 

Con Tableau Data Management, puede administrar mejor los datos dentro del entorno de análisis. De esa manera, se asegura de utilizar siempre datos confiables y actualizados para la toma de decisiones. Desde la preparación de datos hasta la generación de catálogos, la búsqueda y la gobernanza, Tableau Data Management lo ayudará a aumentar la confianza en los datos. Como resultado, podrá acelerar la adopción del análisis de autoservicio. El producto es un conjunto de funcionalidades con licencia independiente. Además, incluye Tableau Prep Conductor y Tableau Catalog, que le permitirán administrar el contenido y los activos de datos de Tableau Server y Tableau Cloud.

¿Qué es Tableau Data Management?

En general, su organización se beneficiará de estrategias de gobernanza de datos y administración de fuentes de datos que se analizan en otras partes de Tableau Blueprint. Más allá de estas metodologías, a menudo escuchará referencias genéricas al término Administración de datos en las comunidades de bases de datos, análisis de datos y visualización. Sin embargo, este término se vuelve más específico cuando se trata de Tableau con Tableau Data Management, un conjunto de funcionalidades complementarias de pago que se puede usar con Tableau Server y Tableau Cloud. Independientemente de si utiliza Tableau Server para Windows o Linux, o Tableau Cloud, las funcionalidades de Tableau Data Management son en su mayoría idénticas (es posible que un pequeño subconjunto de funcionalidades solo esté disponible en Tableau Cloud o Tableau Server).

Tableau Data Management abarca un conjunto de herramientas que ayudan a los administradores y analistas de datos de su organización a administrar contenido y recursos relacionados con datos en su entorno de Tableau. Específicamente, se agregan tres conjuntos de funcionalidades adicionales al adquirir Tableau Data Management:

  • Tableau Catalog

  • Tableau Prep Conductor

  • Conexiones virtuales y directivas de datos

Tableau Catalog

La funcionalidad original de Tableau Data Management, Tableau Catalog proporciona funcionalidades para ayudar a optimizar el acceso, la comprensión y la confianza de las fuentes de datos de Tableau. Al centrarse en áreas como el linaje, la calidad de los datos, la búsqueda y el análisis de impactos, Tableau Catalog puede facilitar que los administradores de datos y los visualizadores/analistas de datos comprendan las fuentes de datos de Tableau Server y Cloud y confíen en ellas. Tableau Catalog incluye funcionalidades adicionales para desarrolladores de Tableau a través de métodos de metadatos en la API de REST de Tableau.

Cuando Tableau Catalog está habilitado inicialmente, analiza todos los elementos de contenido relacionados en su sitio de Tableau Server o Cloud para crear una vista conectada de todos los objetos relacionados (Tableau Catalog se refiere a esto como metadatos de contenido). Esto amplía las capacidades de búsqueda más allá de las simples conexiones de datos. Los administradores de datos y los autores visuales también pueden realizar búsquedas en función de columnas, bases de datos y tablas.

Para reducir la posibilidad de modificar o eliminar inadvertidamente un objeto del que depende otro objeto (por ejemplo, cambiar el nombre o eliminar una columna de base de datos que es clave para un libro de trabajo de producción) la funcionalidad de linaje de Tableau Catalog expone las interrelaciones entre todo el contenido de un sitio de Tableau, incluidas métricas, flujos y conexiones virtuales. Ahora puede ver fácilmente las relaciones entre los objetos y analizar el impacto de un cambio pendiente antes de realizarlo.

 

Para mejorar la confianza en sus fuentes de datos de Tableau, Tableau Catalog proporciona información complementaria, como descripciones ampliadas de objetos relacionados con los datos, la vista Detalles de los datos y etiquetas de palabras claves para conseguir una mayor flexibilidad de búsqueda. Certificar fuentes de datos coloca un icono destacado junto a las fuentes de datos para indicar la confianza del propietario o administrador en la fuente de datos en cuestión. Los elementos de datos (fuentes de datos, columnas, etc.) que puedan ser motivo de preocupación para los consumidores, como datos obsoletos o inactivos, pueden designarse mediante Advertencias de calidad de los datos. Además de una opción de advertencia de calidad de los datos, los datos confidenciales pueden marcarse específicamente con Etiquetas de confidencialidad.

 

 

Tableau Prep Conductor

Si es como muchos clientes de Tableau, habrá descubierto los beneficios de Tableau Prep Builder para crear “flujos” sofisticados de preparación de datos que combinan múltiples fuentes de datos, dan forma a los datos, personalizan columnas y generan resultados en uno o más formatos de datos deseados. Pero una vez que crea el flujo de preparación perfecto, ¿cómo lo automatiza para que se ejecute y actualice total o incrementalmente las fuentes de datos según un programa?

Aquí es donde Tableau Prep Conductor entra en juego, otra funcionalidad de Data Management. Tableau Prep Conductor permite conseguir una programación flexible de los flujos de Tableau Prep, independientemente de si se publican en su entorno de Tableau Server o Tableau Cloud desde Tableau Prep Builder o se crean directamente en un navegador con la Creación web de flujos de Prep. Comience probando su flujo basado en web (puede ejecutar flujos manualmente bajo demanda sin Data Management, pero necesitará adquirir este complemento para programar que los flujos se ejecuten automáticamente con Prep Conductor). El flujo debe ejecutarse hasta su finalización y crear la fuente de datos de salida deseada sin errores antes de programarlo.

Si utiliza Tableau Server, su administrador (o usted, si tiene los privilegios adecuados) puede crear programas personalizados (como "Diario a medianoche", "Domingo al mediodía", etc.) para ejecutar flujos de preparación, de la misma manera que para las actualizaciones de extracción.

Si utiliza Tableau Cloud, se instala de forma predeterminada un conjunto de programas de flujo de preparación predefinidos. No puede personalizarlos ni crear sus propios programas de flujo de preparación.

Programe flujos para que se ejecuten desde el menú Acciones. Un programa de Tarea única ejecutará solo el flujo de preparación seleccionado siguiendo el programa que seleccione. Un programa de Tarea vinculada le permitirá seleccionar uno o más flujos adicionales para ejecutar en secuencia con el flujo seleccionado, en caso de que desee "encadenar" múltiples flujos para ejecutar en un orden específico (tal vez para crear una salida de fuente de datos para usar como datos de entrada para un flujo posterior). Los flujos ahora se ejecutarán cuando estén programados, actualizando o creando automáticamente fuentes de datos en las que se pueden basar los libros de trabajo de Tableau.

Además de la capacidad de programar flujos, Data Management y Tableau Prep Conductor agregan opciones para supervisar éxitos/fracasos del flujo programado, enviar notificaciones por correo electrónico cuando los programas de flujo tienen éxito o fallan, ejecutar flujos mediante programas con la API de REST de Tableau Server/Cloud y beneficiarse de capacidades adicionales de vistas administrativas para supervisar el historial de rendimiento del flujo.

PRÁCTICA RECOMENDADA: Si planea ejecutar una gran cantidad de flujos de Tableau Prep Conductor en Tableau Server, es posible que deba ajustar la escala de su entorno de servidor. Si es necesario, ajuste el rendimiento de su sistema Tableau Server agregando nodos adicionales o procesos del procesador en segundo plano para acomodar la carga de flujo de preparación requerida.

¿Qué ocurre con Tableau Cloud? Si bien no se le pedirá que realice cambios arquitectónicos en Tableau Cloud para la capacidad del flujo de preparación, sí deberá adquirir un Bloque de recursos (una unidad de capacidad informática de Tableau Cloud) para cada flujo simultáneo de Tableau Prep Conductor que desee programar. Determine cuántos programas de flujo simultáneo necesita y adquiera bloques de recursos de Tableau Cloud según corresponda.

 

Conexiones virtuales

Pasemos a la siguiente funcionalidad de Data Management: Conexiones virtuales. Las conexiones virtuales proporcionan un punto de acceso central a los datos. Puede acceder a varias tablas en varias bases de datos. Las conexiones virtuales le permiten administrar la extracción de datos y la seguridad en un solo lugar, a nivel de conexión.

¿Cuándo son útiles las conexiones virtuales?

Si considera una forma tradicional de compartir una conexión de base de datos con varios libros de trabajo en Tableau, probablemente pensará en conectarse directamente a un servidor de base de datos como SQL Server o Snowflake, proporcionar credenciales de inicio de sesión de base de datos, agregar y unir una o más tablas, y luego publicar la fuente de datos en Tableau Server o Tableau Cloud. Si bien puede optar por utilizar esto como una conexión en tiempo real a los datos, es muy posible que desee extraer datos de la fuente de datos para acelerar los libros de trabajo conectados.

Por el bien de esta información, digamos que puede hacer esto tantas veces como desee para acomodar, por ejemplo, un conjunto diferente de tablas o uniones, lo que resultará en múltiples fuentes de datos publicadas (y, quizás, extraídas) utilizadas para una serie de libros de trabajo que tienen diferentes requisitos de tabla/unión, pero que todos usan la misma base de datos inicial.

Ahora, consideremos lo que sucede si algo en la base de datos inicial de SQL Server o Snowflake a la que se hace referencia en esa serie de fuentes de datos cambia: ya sea un cambio en el nombre de las tablas, que se agreguen campos adicionales o que se cambien las credenciales de la base de datos. Ahora se enfrenta a la tarea de abrir cada una de las fuentes de datos creadas previamente, realizar los cambios necesarios para adaptarse al cambio de la base de datos y volver a publicar (y, tal vez, reprogramar las actualizaciones de extracción).

Puede que le resulte mucho más sencillo crear solo una “definición” de conexión de datos inicial que almacene el nombre del servidor de la base de datos, las credenciales y las referencias de las tablas. Y es posible que prefiera extraer datos de esa “definición” más amplia. Luego, cuando necesite crear diferentes fuentes de datos para varias combinaciones de tablas, uniones, etc., puede hacer referencia a esa “definición” inicial en lugar de conectarse directamente a uno o más servidores de bases de datos. Si algo en la estructura central de la base de datos cambia (por ejemplo, cambian los nombres de las tablas o se modifican las credenciales), solo necesita modificar el objeto de “definición” inicial y todas las fuentes de datos dependientes heredan automáticamente los cambios.

La funcionalidad de Data Management introduce esta capacidad de “definición” compartida a través de una conexión virtual. Una conexión virtual es similar a una conexión de fuente de datos estándar en que almacena el servidor de la base de datos, las credenciales de inicio de sesión y las tablas seleccionadas. Y, al igual que una fuente de datos tradicional de Tableau, una conexión virtual puede contener conexiones a más de una base de datos/fuente de datos (cada una con su propio conjunto de credenciales y tablas). Si bien se permiten algunas modificaciones de metadatos en una conexión virtual (por ejemplo, ocultar o cambiar el nombre de campos), las tablas no se unen dentro de la conexión virtual. Cuando finalmente utilice la conexión virtual como fuente directa para un libro de trabajo o como tipo de conexión para una fuente de datos publicada adicional, puede unir tablas y realizar más personalizaciones en la fuente de datos.

Una vez que se haya creado y publicado una conexión virtual en Tableau Server o Tableau Cloud y se hayan establecido los permisos adecuados, podrá conectarse a la conexión virtual en Tableau Desktop o Tableau Server/Cloud como lo haría con cualquier otra fuente de datos. Sin embargo, no necesitará especificar la ubicación del servidor de la base de datos ni proporcionar credenciales, e inmediatamente podrá unir tablas y proceder a visualizar datos o publicar la fuente de datos.

 

Directivas de datos

Además de las funcionalidades de conexión de base de datos centralizada descritas anteriormente, las conexiones virtuales de Tableau Data Management también brindan una opción de seguridad de nivel de fila centralizada más optimizada con Directivas de datos. Utilice una directiva de datos para aplicar seguridad de nivel de fila a una o más tablas en una conexión virtual. Una directiva de datos filtra los datos, lo que garantiza que los usuarios vean solo los datos que se supone que deben ver. Las directivas de datos se aplican tanto a las conexiones en tiempo real como a las de extracción.

¿Cuándo son útiles las directivas de datos?

Es común en muchas organizaciones restringir automáticamente los datos visibles en una visualización solo a los que son aplicables al usuario actual. Pongamos como ejemplo un dashboard compartido que contiene detalles del pedido en un objeto de tabulación cruzada.

  • Si es el director de ventas de un territorio grande, la tabulación cruzada de detalles mostrará los pedidos de cada ejecutivo de cuenta en su territorio.

  • Sin embargo, si es un ejecutivo de cuentas individual, la tabulación cruzada de detalles solo mostrará los pedidos de sus cuentas.

Este escenario requiere que se implemente la Seguridad a nivel de fila en su entorno de Tableau, lo que se puede lograr con uno de varios métodos, que incluyen:

  • Seguridad a nivel de fila en la base de datos. Cada vez que se ve una visualización, se solicita al espectador que inicie sesión en la base de datos subyacente con sus propias credenciales o que sus credenciales se hereden de su cuenta de usuario de Tableau. El conjunto de datos resultante está restringido únicamente a los datos que pueden ver según las credenciales proporcionadas. Esto no solo puede volverse tedioso rápidamente, ya que cada espectador debe mantener sus propias credenciales, sino que la conexión de datos en tiempo real puede afectar el rendimiento al imponer una gran carga a la base de datos subyacente. Además, algunas opciones para transferir credenciales a conexiones en tiempo real pueden estar restringidas con Tableau Cloud.

  • Filtros de usuarios de Tableau. Los filtros de usuario se aplican al crear hojas de trabajo individuales dentro de un libro. Al especificar combinaciones de credenciales de usuario individuales de Tableau o pertenencia en uno o más grupos de usuarios de Tableau, las hojas de trabajo individuales se pueden filtrar para mostrar solo datos relevantes para ese usuario. Esto puede resultar tedioso, ya que cada hoja de trabajo individual dentro de un libro de trabajo requiere que se proporcionen filtros de usuario; no hay forma de especificar un filtro de usuario en un grupo grande de libros de trabajo con un solo proceso. Además, si un usuario recibe inadvertidamente permisos de edición para el libro, puede arrastrar fácilmente el filtro de usuario fuera del estante Filtros y ver todos los datos subyacentes para los que quizás no tenga permiso.

Al utilizar un subconjunto del lenguaje de cálculo de Tableau, las directivas de datos pueden especificar reglas sofisticadas (quizás mediante el uso de una “tabla de derechos” relacionada en una base de datos) para personalizar y limitar los datos que devuelve la conexión virtual, según el ID del usuario o la pertenencia a grupos. Esto no solo mantiene la seguridad del nivel de fila en el nivel de la fuente de datos (todos los libros conectados a la fuente de datos heredarán automáticamente la seguridad y adoptarán cualquier cambio realizado dentro de la conexión virtual), sino que agrega una capa adicional de seguridad al restringir cualquier modificación de las directivas de datos solo a aquellos con permisos de edición para la conexión virtual original.

 

 

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!