Crear extracciones en la web
Puede extraer sus fuentes de datos en la web (sin usar Tableau Desktop) para mejorar el rendimiento de la fuente de datos y admitir funciones analíticas adicionales. Cuando extraiga la fuente de datos, Tableau copiará los datos del almacén de datos remoto en Tableau Server o Tableau Cloud. Para obtener más información sobre las ventajas de extraer los datos, consulte Extraer los datos. En la web, puede extraer mientras está en la creación web o mientras está en el servidor de contenido.
Crear extracciones en la creación web
Puede crear extracciones directamente en la creación web, con configuraciones predeterminadas.
Extraer una fuente de datos insertada en la creación web
Complete los siguientes pasos para crear una extracción en la creación web.
Consejo: Se recomienda finalizar el modelo de datos antes de crear la extracción. La creación de extracciones puede tardar mucho tiempo y cualquier cambio en el modelo de datos, como agregar nuevas tablas lógicas, invalidará la extracción.
- Seleccione la pestaña Fuente de datos de la esquina inferior izquierda del panel de creación web. Para los libros de trabajo nuevos, se iniciará en la pestaña Fuente de datos.
- En la esquina superior derecha, cambie el tipo de conexión de En tiempo real a Extracción.
- Seleccione Crear extracción. Verá el cuadro de diálogo Crear extracción.
La creación de extracciones puede tardar mucho tiempo y puede cerrar la sesión de creación mientras se crea la extracción. Para asegurarse de que no se pierde la creación de extracciones, seleccione Notificarme cuando se complete en el cuadro de diálogo para especificar una ubicación para el libro extraído que se va a guardar. Si la extracción se realiza correctamente, el libro de trabajo se guardará en la ubicación especificada y se le notificará que puede continuar con la sesión de creación web.
Si se produce un error en la creación de extracciones, se le notificará que no se ha podido crear la extracción y podrá restaurar los cambios no guardados volviendo a abrir el libro de trabajo original en la creación web.
Establecer la configuración de la extracción
Puede configurar una o más de las opciones siguientes para indicar a Tableau cómo almacenar datos, definir filtros para datos y limitar la cantidad de datos de una extracción.
Decidir cómo se almacenan los datos de la extracción
Puede configurar Tableau para que almacene los datos de la extracción con una de estas dos estructuras (esquemas): tablas lógicas (esquema no normalizado) o tablas físicas (esquema normalizado). Para obtener más información sobre las tablas lógicas y físicas, consulte El modelo de datos de Tableau. La opción que elija depende de sus necesidades.
Tablas lógicas
Las tablas lógicas almacenan datos mediante una tabla de extracción para cada tabla lógica de la fuente de datos. Las tablas físicas que definen una tabla lógica se combinan y almacenan con esa tabla lógica. Por ejemplo, si una fuente de datos se creó con una sola tabla lógica, los datos se almacenarían en una sola tabla.
Si una fuente de datos se compone de tres tablas lógicas (cada una contiene varias tablas físicas), los datos de extracción se almacenarían en tres tablas, una para cada tabla lógica.
Seleccione Tablas lógicas cuando quiera limitar la cantidad de datos de la extracción con propiedades adicionales como filtros de extracción, agregaciones, números máximos u otras funcionalidades que requieran el uso de datos no normalizados. También se utiliza cuando los datos utilizan funciones de paso (RAWSQL). Esta es la estructura predeterminada que usa Tableau para almacenar datos de extracciones.
Si usa esta opción cuando la extracción contiene uniones, las uniones se aplicarán al crear la extracción.
Tablas físicas
Las tablas físicas almacenan datos mediante una tabla de extracción para cada tabla física de la fuente de datos.
Seleccione Tablas físicas si la extracción está compuesta por tablas combinadas con una o más uniones de igualdad y cumple con las condiciones para usar la opción “Tablas físicas” que se indican a continuación. Si usa esta opción, las uniones se realizarán en el momento de ejecutar la consulta.
Esta opción puede mejorar el rendimiento y ayudar a reducir el tamaño del archivo de extracción. Para obtener más información sobre la recomendación de Tableau de utilizar la opción “Tablas físicas”, consulte Consejos para usar la opción de tablas físicas en la ayuda de Tableau Desktop.
En algunos casos, también puede utilizar esta opción como solución alternativa para la seguridad de nivel de fila. Para obtener más información sobre la seguridad de nivel de fila con Tableau, consulte Restringir el acceso en el nivel de fila de datos en la ayuda de Tableau Desktop.
Condiciones para usar la opción Tablas físicas
Para guardar la extracción con la opción Tablas físicas, los datos de la extracción deben cumplir con todas las condiciones que se indican a continuación.
- Todas las uniones entre las tablas físicas son uniones de igualdad (=).
- Los tipos de datos de las columnas utilizadas para las relaciones o uniones son idénticos.
- No se usan funciones de paso (RAWSQL).
- No se configuran actualizaciones incrementales.
- No se configuran filtros de extracción.
- No se configuran valores de N principales ni muestras.
- Cuando la extracción se guarda como tablas físicas, no se pueden anexar datos.
- Para las tablas lógicas, no puede anexar datos a extracciones que tienen más de una tabla lógica.
Nota: Las opciones Tablas lógicas y Tablas físicas afectan solo a la manera en que se almacenan los datos en la extracción. Las opciones no afectan a la forma en la que las tablas de la extracción se muestran en la página Fuente de datos.
Determinar la cantidad de datos que se extraerán
Seleccione Añadir para definir uno o varios filtros para limitar la cantidad de datos que se van a extraer en función de los campos y de sus valores.
Agregar los datos a la extracción
Seleccione Agregar datos para dimensiones visibles para agregar las medidas mediante la agregación predeterminada. Agregar los datos consolida las filas, y puede minimizar el tamaño del archivo de extracto y aumentar el rendimiento.
Cuando opte por agregar los datos, también puede seleccionar Organizar según un nivel de fecha especificado, como Año, Mes, etc. Los ejemplos siguientes muestran cómo se extraerán los datos para cada opción de agregación que puede elegir.
Datos originales | Cada registro aparece en una fila separada. Hay siete filas en los datos. | |
Agregar datos para dimensiones visibles (sin organización) | Se han agregado los registros con la misma fecha y región a una fila única. Hay cinco filas en el extracto. | |
Agregar datos para dimensiones visibles (organizar fechas por Mes) | Las fechas se han organizado según el nivel Mes y se han agregado los registros con la misma región a una fila única. Hay cincos filas en el extracto. |
Seleccionar las filas que se extraerán
Seleccione el número de filas que desea extraer.
Puede extraer todas las filas o N principales. Tableau primero aplica algunos filtros y agregaciones y luego extrae el número de filas de los resultados filtrados y agregados. El número de opciones de filas depende del tipo de fuente de datos desde la que efectúa la extracción.
Notas:
- No todas las fuentes de datos admiten muestras. Por lo tanto, puede que no vea la opción Muestras en el cuadro de diálogo Extraer datos.
- Los campos que oculte en primer lugar en la página de fuente de datos o en la pestaña de hoja quedarán excluidos del extracto.
Definir la configuración de Actualización incremental
La mayoría de las fuentes de datos admiten las actualizaciones incrementales. En lugar de actualizar toda la extracción, puede configurar una actualización para que solo se añadan las filas que sean nuevas desde la última vez que extrajo los datos.
Por ejemplo, puede tener una fuente de datos que se actualice a diario con transacciones de ventas nuevas. En lugar de volver a crear toda la extracción cada día, simplemente puede agregar las nuevas transacciones que ocurrieron ese día. Para poder utilizar la opción Incremental al programar una actualización, primero debe definir la configuración.
Si lo desea, puede realizar una actualización completa periódicamente solo para asegurarse de que dispone de los datos más recientes.
Nota: Si cambia la estructura de datos de los datos de origen (por ejemplo, se agrega una nueva columna), deberá realizar una actualización de extracción completa antes de volver a empezar a realizar actualizaciones incrementales.
Configurar actualización incremental
Siga los pasos que aparecen a continuación para configurar una extracción que se actualice de forma incremental; pero compruebe primero que ha seleccionado Todas las filas como la cantidad de filas a extraer.
La actualización incremental solo puede definirse cuando extrae todas las filas en la base de datos. No puede incrementar una extracción de muestra.
- Seleccione Actualización incremental.
- Elija una tabla para actualizar.
- Seleccione una columna para usar para identificar nuevas filas.
- Introduzca un rango de subfecha en Rango de fechas mínimo que se va a actualizar. Tiene la opción de elegir un rango de tiempo específico en días, horas, minutos o segundos dentro de este campo.
Por ejemplo, al seleccionar una columna Fecha o Fecha y hora en Tableau, los usuarios pueden actualizar los datos de la extracción dentro de un período de tiempo específico, como 14 días a partir de la fecha de actualización. Esta funcionalidad es beneficiosa para fuentes de datos que permiten inserciones y modificaciones retroactivas dentro de un período de tiempo definido. Al utilizar la actualización de extracciones incrementales, los usuarios pueden capturar estos cambios junto con cualquier dato nuevo de manera eficiente.
Usar configuración avanzada
Puede ampliar Configuración avanzada para establecer cómo se recuperan las filas nuevas.
Nota: Si ha establecido un rango de fechas mínimo para la actualización, no se podrá acceder a la funcionalidad Configuración avanzada.
Configuración avanzada le permite reemplazar las últimas filas agregadas actualizando los valores iguales o mayores que el último valor registrado, o conservar las últimas filas agregadas actualizando solo el extracto con los valores superiores al último valor registrado.
En el primer enfoque, Tableau permite a los usuarios actualizar de forma incremental las extracciones con una columna de clave no única, como fecha, fecha y hora o ID.
Este método agrega un nuevo paso al realizar una actualización incremental. Tableau eliminará primero las filas del extracto que sean iguales que el valor más elevado registrado anteriormente. Luego, Tableau consulta todas las filas iguales o superiores al valor más elevado registrado anteriormente, lo que seleccionará todas las filas eliminadas y las nuevas.
Asimismo, aún puede optar por no reemplazar las últimas filas agregadas y añadir únicamente aquellas filas con valores superiores al último valor registrado.
Para finalizar, seleccione Crear extracción.
Consideraciones a la hora de realizar una actualización incremental
Editar un extracto:
Si va a editar una extracción existente, se muestra la última actualización para que pueda estar seguro de que está actualizando la extracción con los datos correctos.
Actualización completa:
Una actualización completa reemplaza todas las filas con los datos de la fuente de datos original cada vez que actualiza la extracción. Una actualización completa puede llevar más tiempo y resultar cara en la base de datos.
Motor de datos:
El motor de datos, que es el mecanismo subyacente que emplea Tableau para crear extracciones, almacena valores de tiempo con una precisión de hasta 3 decimales.
Si especifica una columna de fecha y hora o de marca de tiempo para identificar filas nuevas mediante una columna y la base de datos utiliza una precisión superior a Tableau, pueden generarse filas duplicadas tras una actualización incremental.
Por ejemplo, si la base de datos tiene dos filas, una con el valor de fecha y hora 2015-03-13 17:30:56.502352 y otra con el valor de fecha y hora 2015-03-13 17:30:56.502852, Tableau almacenará ambas filas con el valor de fecha y hora 2015-03-13 17:30:56.502, por lo que se crearán filas duplicadas.
Limitaciones
- No se pueden crear extracciones de fuentes de datos insertadas que hagan referencia a fuentes de datos publicadas. Como solución alternativa, cree la extracción directamente en la fuente de datos publicada. Para obtener más información, consulte Extraer una fuente de datos publicada en el servidor de contenido.
- No puede crear extracciones para fuentes de datos basadas en archivos. Las fuentes de datos basadas en archivos ya tienen funcionalidades especiales de rendimiento y la adición de la extracción no tendrá ningún beneficio de rendimiento.
- Esta funcionalidad no se aplica a las fuentes de datos basadas en Bridge de Tableau Cloud.
- Limitación de SQL personalizado: las consultas SQL personalizadas no son compatibles con la configuración avanzada. Los usuarios que dependen de SQL personalizado deberán ajustar su enfoque si desean utilizar la configuración avanzada para una actualización incremental.
Crear extracciones en el servidor de contenido
Extraer una fuente de datos publicada en el servidor de contenido
Complete los siguientes pasos para extraer una fuente de datos publicada.
- Inicie sesión como administrador o como propietario de la fuente de datos.
- En la pestaña Contenido, seleccione Explorar y luego elija Fuentes de datos.
- Seleccione una fuente de datos haciendo clic en el nombre de la fuente de datos.
- En la parte superior de la pantalla, bajo el nombre de la fuente de datos, seleccione el menú desplegable En tiempo real.
- Cambie el tipo de conexión de En tiempo real a Extracción. Si la funcionalidad de cifrado de extracción en reposo está activada en el sitio, seleccione Cifrada o Sin cifrar.
- Si aparece un mensaje de error sobre las credenciales insertadas, inserte sus credenciales en la fuente de datos. Para ello, seleccione Editar conexión. Seleccione "Contraseña insertada en conexión" y, a continuación, elija Guardar.
Extraer una fuente de datos insertada en el servidor de contenido
Complete los siguientes pasos para extraer una o más fuentes de datos insertadas en un libro de trabajo publicado.
- Inicie sesión como administrador o como propietario de la fuente de datos.
- Vaya al libro de trabajo publicado.
- Vaya a la pestaña Fuentes de datos.
- Seleccione una o varias de las fuentes de datos.
- Seleccione el botón Acción.
- Seleccione Extracción. Si la funcionalidad de cifrado de extracción en reposo está activada en el sitio, seleccione Cifrada o Sin cifrar.
Limitaciones
- Sus credenciales de conexión se deben insertar en la fuente de datos.
- No se pueden crear extracciones de fuentes de datos insertadas que hagan referencia a fuentes de datos publicadas. Como solución alternativa, cree la extracción directamente en la fuente de datos publicada.
- No puede crear extracciones para fuentes de datos basadas en archivos. Las fuentes de datos basadas en archivos ya tienen funcionalidades especiales de rendimiento y la adición de la extracción no tendrá ningún beneficio de rendimiento.
- Esta funcionalidad no se aplica a las fuentes de datos basadas en Bridge de Tableau Cloud.
Mantener los datos de flujo extraídos actualizados
Una vez extraídos los datos, puede configurar opcionalmente un programa de actualización de extracciones para mantener los datos actualizados. Para obtener más información, consulte Actualizar los datos de un programa.
Supervisar y administrar extracciones
Los administradores del servidor pueden supervisar la creación de extracciones en la vista administrativa Tareas en segundo plano para extracciones. Para obtener más información, consulte Tareas de fondo para extracciones.
Los administradores del servidor pueden administrar extracciones en la página Trabajos. Para obtener más información, consulte Gestionar trabajos del procesador en segundo plano en Tableau Server.
Los trabajos de creación de extracciones, como los trabajos de actualización de extracciones, tienen un límite de consulta máximo antes de que se alcance el tiempo de espera límite. Esto es para evitar que los trabajos se ejecuten para siempre y que usen una cantidad ilimitada de recursos del servidor. Los administradores de servidor pueden configurar el tiempo de espera del límite de consultas de extracción mediante la configuración de la interfaz de línea de comandos de TSM backgrounder.querylimit
. Para obtener más información, consulte Opciones de tsm configuration set.
Los administradores del servidor pueden administrar la creación web. Para obtener más información, consulte Establecer el acceso y las funciones de creación web de un sitio.