Optimización de extracciones

Intente optimizar los extractos si los programas de extractos se corresponden con un uso de recursos elevado o si los extractos tardan mucho tiempo en completarse.

Nota: En este tema se usa el libro de trabajo de rendimiento de ejemplo de la sección de supervisión. Para obtener más información, consulte Analizar datos con el libro de trabajo de rendimiento de muestra.

Cuándo optimizar para extractos

Un uso elevado de CPU se corresponde con programas de extractos

Use el dashboard Trabajos en segundo plano del libro de trabajo de rendimiento de ejemplo para ver el número de trabajos en segundo plano ejecutados por Tableau Server, incluidos los trabajos de actualización de extractos. En el dashboard también se muestra la cantidad de tiempo que se retrasan los trabajos en segundo plano (es decir, la cantidad de tiempo entre que se programa un trabajo de segundo plano y el momento en que se ejecuta). Si ve retrasos prolongados en horas específicas del día, o bien si se ejecutan muchos trabajos de forma simultánea, intente distribuir los programas de trabajos en diferentes horas del día para reducir la carga en el servidor.

Además, compare las horas en que haya un gran número de trabajos en segundo plano o retrasos prolongados con el uso de CPU del servidor. Use el dashboard Uso de CPU para mostrar el porcentaje del total del uso de CPU y el porcentaje del uso de CPU de cada proceso. Como el proceso del componente de segundo plano ejecuta trabajos en segundo plano, es el primer proceso que se verá afectado cuando se ejecuten varios trabajos de actualización de extractos o cuando haya trabajos de actualización de extractos que tardan en completarse. Tenga en cuenta que el uso de CPU del proceso del componente de segundo plano se actualiza periódicamente, pero alcanza el 100 % brevemente. Esto indica que hay trabajos de actualización intensivos en un programa periódico.

Nota: El porcentaje de uso de CPU para procesos individuales puede sumar más del 100 %, ya que el uso del procesador de los procesos individuales se mide para un núcleo de procesador específico. En cambio, el uso total de CPU se mide para todos los núcleos del procesador.

Los extractos producen errores o se ejecutan con lentitud

Use la vista administrativa Tareas de fondo para extractos para determinar el número de extractos que producen errores y cuánto tiempo tardan los extractos en completarse. Si se producen errores con frecuencia, esto puede indicar un problema con una fuente de datos específica.

Formas de optimizar para extractos

Cuando un uso de CPU elevado se corresponde con programas de actualización de extractos, como ocurre en el ejemplo anterior, es necesario optimizar para extractos.

Ajustar el programa de actualización de extractos

Use el dashboard Trabajos en segundo plano del libro de trabajo de rendimiento de ejemplo para identificar las horas óptimas para ejecutar extractos. Además de ejecutar extractos en horas de menor actividad, puede distribuir actualizaciones de extractos para minimizar la carga simultánea en el servidor. Si las actualizaciones de extractos siguen causando problemas, reduzca la frecuencia de las actualizaciones de extractos en la medida de lo posible de estas formas:

  • Programe las extracciones en horas en las que el servidor no esté ocupado.

  • Reduzca la frecuencia de las actualizaciones.

Reducir el tiempo de carga de extractos específicos

Use la vista administrativa Tareas de fondo para extractos para identificar los extractos que producen errores y los extractos que tardan mucho tiempo en completarse.

  • Reduzca el tamaño de los extractos. Puede ayudar a mejorar el rendimiento del servidor si mantiene el conjunto de datos de los extractos con un tamaño reducido, mediante el filtrado o el agregado, y la restricción, así como ocultar los campos no usados. Para realizar estos cambios, use las opciones de Tableau Desktop Ocultar campos no utilizados y Agregar datos para dimensiones visibles. Para obtener más información, consulte Crear un extracto en la ayuda de Tableau.

    Para obtener consejos generales sobre cómo crear libros de trabajo que tengan un buen rendimiento, busque “rendimiento” en la ayuda de Tableau. Para comprobar el rendimiento de los libros de trabajo después de publicarlos en Tableau Server, puede crear un registro del rendimiento. Para obtener más información, consulte Crear un registro del rendimiento.

  • Use trabajos de actualización incremental. Los trabajos de actualización incremental anexan filas a un extracto existente, en lugar de crear el extracto desde cero. Este tipo de actualización de extracto se ejecuta rápidamente, ya que solo procesa los datos que se añadieron desde la última vez que se ejecutó el trabajo de actualización de extractos. Sin embargo, no tiene en cuenta los datos que se actualizaron, en lugar de los que se anexaron a una fuente de datos. Como resultado, si ejecuta trabajos de actualización incremental, es posible que de forma ocasional ejecute trabajos de actualización completa. Por ejemplo, es posible que ejecute un trabajo de actualización completa una o dos veces por semana para una fuente de datos, en lugar de hacerlo todos los días.

Configurar el modo de ejecución para actualizaciones de extractos

Al crear programas de actualización de extractos, asegúrese de que se ejecutan en el modo de ejecución en paralelo. Al ejecutar un programa en paralelo, se ejecuta en todos los procesos del componente de segundo plano disponibles, incluso si el programa solo contiene una tarea de actualización. Cuando se ejecuta una programación en serie, solo se ejecuta un proceso del componente de segundo plano. De forma predeterminada, el modo de ejecución se establece en paralelo, para que las tareas de actualización finalicen lo antes posible.

Sin embargo, en algunas circunstancias, puede que tenga sentido configurar el modo de ejecución en serie. Por ejemplo, puede configurar el modo de ejecución en serie si un trabajo de gran tamaño evita que se ejecuten otros programas, ya que usa todos los procesos del componente de segundo plano disponibles.

Aumentar el número de procesos del componente de segundo plano

Un solo proceso en segundo plano puede consumir el 100 % de un único núcleo de CPU para determinadas tareas. Como resultado, el número total de instancias que debe ejecutar depende de los núcleos disponibles del equipo. Si tiene instalado Tableau Server en un clúster y ejecuta procesos del componente de segundo plano en un nodo separado, como norma general se recomienda configurar el número de procesos del componente de segundo plano entre la mitad del número de núcleos y el número total de núcleos del equipo que ejecutan los procesos del componente de segundo plano.

Para obtener más información sobre la configuración de procesos, consulte Configurar nodos.

Aislar los procesos

Si instaló Tableau Server en un clúster, la mejor opción es mover los procesos del componente de segundo plano a un nodo separado para evitar la contención de recursos. Esto se debe a que el proceso del componente de segundo plano realiza un uso intensivo de la CPU y se ejecuta en el mismo nodo donde otros procesos que también realizan un uso intensivo de la CPU se ejecutan, lo que puede reducir el rendimiento del servidor. Por ejemplo, el proceso de VizQL Server y el proceso del motor de datos pueden realizar un uso intensivo de la CPU. Lea el procedimiento de configuración de dos nodos en el tema Configuraciones básicas recomendadas para obtener más información.

¡Gracias por sus comentarios!