Actualizar datos de flujo mediante la actualización incremental
Nota: a partir de la versión 2020.4.1, puede crear y editar flujos en Tableau Server y Tableau Cloud. El contenido de este tema se aplica a todas las plataformas, a menos que se especifique lo contrario. Para obtener más información acerca de la creación de flujos en la web, consulte Tableau Prep en la web(El enlace se abre en una ventana nueva) en la ayuda de Tableau Server.
A partir de la versión 2020.2.1 de Tableau Prep Builder y en la web, puede configurar las entradas y salidas de flujo para que se actualicen de forma incremental, de modo que solo se recuperen y procesen las nuevas filas cuando se ejecuta el flujo, lo que le ahorra tiempo y recursos.
Por ejemplo, si el flujo incluye datos de transacciones que se actualizan diariamente, puede configurar la actualización incremental para recuperar y procesar solo las nuevas transacciones todos los días. Luego, puede ejecutar una actualización completa semanal o mensual para actualizar todos los datos del flujo.
Nota: Para ejecutar la actualización incremental en entradas de flujo que utilizan el conector de Salesforce, debe usar Tableau Prep Builder 2021.1.2 o posterior. La actualización incremental no es compatible actualmente cuando se escriben salidas de flujo en Microsoft Excel o CRM Analytics.
Para ejecutar el flujo mediante la actualización incremental, Tableau Prep necesita la siguiente información:
- El campo que detecta nuevas filas en la tabla de entrada.
- El campo que se va a utilizar para comparar los últimos valores procesados en la salida de flujo con los valores de la entrada para determinar qué filas son nuevas. Para obtener más información, consulte Actualización incremental con anexo.
- Cómo desea escribir los nuevos datos en las tablas. Puede agregar nuevos datos a las tablas existentes o sobrescribir los datos de la tabla con los nuevos datos o, a partir de la versión 2020.3.1 de Tableau Prep Builder y en la web, sustituir los datos de una tabla existente.
Opciones de actualización de flujo
Tableau Prep permite seleccionar cómo se actualizan los datos y cómo se actualizan las tablas con la salida de flujo. En la tabla siguiente se describen las diferentes opciones y sus ventajas.
Actualizar combinación | Datos procesados | Actualización de tabla | Ventajas |
---|---|---|---|
Actualización completa + Crear tabla | Todos | Cree o sobrescriba la tabla actual con el conjunto de datos completo. | Actualice todos los datos de cada ejecución de flujo. |
Actualización completa + Anexar a la tabla | Todos | Agregue nuevas filas a la tabla existente. | Realice un seguimiento de los datos nuevos y existentes en cada ejecución de flujo. Anexar a la tabla no está disponible para los tipos de salida .csv. |
Actualización completa + Reemplazar datos | Todos | Reemplace las filas de la tabla existente. | Mantenga la estructura de esquema de tabla existente, pero reemplace todos los datos por cada ejecución de flujo. |
Actualización incremental + Crear tabla | Solo filas nuevas | Cree o sobrescriba la tabla existente solo con las nuevas filas. | Cree una nueva tabla solo con las nuevas filas como el conjunto de datos completo. Si la fuente de datos de salida no existe o no se puede conectar a ella cuando se ejecuta el flujo, el flujo fallará. Es necesaria una actualización completa para crear la salida antes de que pueda usarse de forma incremental. |
Actualización incremental + Anexar a la tabla | Solo filas nuevas | Agregue las nuevas filas a la tabla actual. | Agregue solo las nuevas filas a la tabla actual. Anexar a la tabla no está disponible para los tipos de salida .csv. Consulte Actualización incremental con anexo. |
Actualización incremental + Reemplazar datos | Solo filas nuevas | Reemplace todas las filas de la tabla actual solo con las nuevas filas. | Mantenga la estructura de esquema de tabla actual, pero reemplace todos los datos con solo las filas nuevas, lo que lo convierte en el conjunto de datos completo. |
Configurar la actualización incremental
Para configurar el flujo para que use la actualización incremental, debe especificar la configuración en los pasos Entrada y en los pasos de Salida donde desea usar esta opción. En el paso Entrada, especifique cómo Tableau Prep encontrará las nuevas filas. En el paso Salida, especifique cómo se escriben las nuevas filas en la tabla. Al ejecutar el flujo, puede seleccionar un tipo de actualización completo o incremental.
Consejo: después de configurar los pasos de entrada y salida para la actualización incremental, puede conservar las configuraciones y reutilizarlas. Copie y pegue los pasos para usarlos en otro lugar del flujo actual o, en Tableau Prep Builder, use Guardar pasos como flujo para guardar los pasos seleccionados en un archivo local o en el servidor para poder reutilizarlos en otros flujos. Para obtener más información sobre cómo copiar, pegar y reutilizar pasos, consulte Copiar pasos, acciones y campos.
- En el panel Flujo, seleccione los pasos de entrada con los que quiere usar la actualización incremental.
- En el panel Entrada de la pestaña Configuración, en la sección Actualización incremental (Configurar actualización incremental), establezca las siguientes opciones:
Seleccione Habilitar actualización incremental (Habilitar en versiones anteriores).
Campo de entrada (Identificar nuevas filas mediante el campo en versiones anteriores): seleccione el campo que quiera actualizar en sus datos de entrada. A este campo se le debe asignar un tipo de datos Número (total),Fecha o Fecha y hora. Actualmente, solo puede seleccionar un solo campo.
Nota: puede eliminar o cambiar el nombre de este campo más adelante en el flujo, siempre y cuando el campo que especifique en el Campo de salida (Nombre de campo en la salida en versiones anteriores) se pueda utilizar para comparar este campo con la salida más reciente para encontrar nuevas filas.
Salida: seleccione la salida relacionada con la entrada y que incluye el campo que se utilizará para comparar filas.
Campo de salida (Nombre de campo en la salida en versiones anteriores): seleccione el campo que se utilizará para comparar los últimos valores procesados en la salida de flujo con los valores de la entrada para buscar nuevas filas. Este campo debe tener el mismo tipo de datos que el campo especificado en el campo de entrada (Identificar nuevas filas mediante el campo en versiones anteriores).
Actualización incremental con anexo
La actualización incremental primero busca el valor máximo existente del campo incremental en la salida. Luego filtra las filas de la entrada para agregar solo filas con un valor mayor en el campo incremental. Por ejemplo:
Tabla existente:
Col1 Col2 ID 5 Fila 5 Agregue nuevas filas a la tabla según col1:
Col1 Col2 ID 1 NewRow1 ID 6 NewRow6 - NewRow1 no se agrega.
- Se agrega NewRow6.
Configurar opciones de escritura
Para terminar de configurar la actualización incremental, establezca las opciones de escritura de salida para especificar cómo se escriben las nuevas filas en las tablas. Todas las salidas relacionadas con el paso de entrada configurado tienen una opción de escritura predeterminada seleccionada, pero puede cambiarla a una opción admitida.
Puede enviar las filas a un archivo (solo Tableau Prep Builder), una fuente de datos publicada o una base de datos. De forma predeterminada, las salidas a extracciones .hyper locales o publicadas se establecen en Anexar a tabla. Las salidas a los tipos de archivo .csv se establecen en Crear tabla.
En el panel Flujo, seleccione los pasos de salida con los que quiere usar la actualización incremental.
En el panel Salida, en la sección Opciones de escritura, vea la opción de escritura predeterminada y realice los cambios necesarios.
- Crear tabla: esta opción crea una nueva tabla o reemplaza la tabla actual con la nueva salida.
- Anexar a la tabla: esta opción agrega los nuevos datos a la tabla actual. Si la tabla aún no existe, se crea una nueva tabla cuando se ejecuta por primera vez el flujo y las ejecuciones posteriores agregarán nuevas filas a esta tabla. No está disponible para los tipos de salida .csv. Para obtener más información acerca de las combinaciones de actualización admitidas, consulte Opciones de actualización de flujo
- Reemplazar datos(Tableau Prep Builder 2020.3.1 y versiones posteriores y en la web): esta opción está disponible cuando se desea volver a escribir la salida en una tabla existente en una base de datos. Reemplaza los datos de la tabla de base de datos con los datos de flujo, pero mantiene la estructura del esquema de tabla.
Ejecutar el flujo
Puede ejecutar flujos individuales mediante la actualización incremental en Tableau Prep Builder en la web o desde la línea de comandos. Para obtener información sobre cómo ejecutar el flujo desde la línea de comandos, consulte Ejecutar el flujo con la actualización incremental habilitada
Si tiene Data Management con Tableau Prep Conductor habilitado, puede ejecutar su flujo usando una actualización incremental con un programa en Tableau Server o Tableau Online.
Nota: En las versiones anteriores, las opciones de escritura se establecen en Tableau Prep Builder y no se pueden cambiar al ejecutar el flujo en Tableau Server o Tableau Cloud. A partir de la versión 2020.4 de Tableau Server y Tableau Cloud, puede editar el flujo directamente en la web. Para obtener más información sobre cómo usar Tableau Prep en la web, consulte Tableau Prep en la web(El enlace se abre en una ventana nueva) en la ayuda de Tableau Server.
Tableau Prep ejecuta una actualización completa de todas las salidas, independientemente de la opción de ejecución que seleccione si no se encuentra ninguna salida existente. Las ejecuciones de flujo posteriores utilizan el proceso de actualización incremental y recuperan y procesan solo las nuevas filas a menos que falten datos de configuración de actualización incremental o se quite la salida actual.
En el menú superior, haga clic en la opción desplegable del botón Ejecutar.
En el panel Salida, haga clic en la opción desplegable del botón Ejecutar flujo.
En el panel Flujo, haga clic en el menú desplegable del botón Ejecutar situado junto al paso Salida.
Si una entrada con la actualización incremental habilitada está asociada a varias salidas, esas salidas deben ejecutarse juntas y deben usar el mismo tipo de actualización. Al ejecutar la actualización en Tableau Prep, se muestra un cuadro de diálogo que le informa de que debe ejecutar ambas salidas juntas.