Análisis con la segunda fecha en Tableau Desktop

Esta es la segunda fase del tutorial y se da por hecho que se han seguido los pasos de la primera fase, Buscar la segunda fecha con Tableau Prep.

En la primera fase hemos tomado nuestro conjunto de datos original y le hemos dado forma para responder a las siguientes preguntas:

  1. ¿Cuántos días transcurrieron entre la primera y la segunda infracción de cada conductor?

  2. Compare los importes de las multas correspondientes a la primera y a la segunda infracción. ¿Existe alguna correlación entre ellos?

  3. En total, ¿qué conductor pagó más? ¿Quién pagó menos?

  4. ¿Cuántos conductores cometieron varios tipos de infracciones?

  5. ¿Cuál fue el importe de multa medio de los conductores que nunca habían asistido a un curso de seguridad vial?

A medida que exploramos estas preguntas, queda claro que existen algunos pros y contras para la primera estructura de datos que hemos creado. Volveremos a Tableau Prep Builder y haremos algunas modificaciones adicionales, y luego veremos cómo afecta al mismo análisis en Tableau Desktop. Por último, veremos un enfoque único de Tableau Desktop del análisis utilizando expresiones de nivel de detalle (LOD) con los datos originales.

El objetivo de este tutorial es presentar varios conceptos en el contexto de un escenario real y tratar varias opciones, sin establecer preceptivamente cuál es la mejor. Al final, debería tener una idea más clara de cómo afecta la estructura de datos a los cálculos y análisis, así como un mejor conocimiento de distintos aspectos de Tableau Prep y de los cálculos en Tableau Desktop.

Nota: para llevar a cabo las tareas de este tutorial, deberá descargar los datos y tener instalado Tableau Prep Builder y, opcionalmente, Tableau Desktop.

Para instalar Tableau Prep y Tableau Desktop antes de continuar con este tutorial, consulte Guía de implementación de Tableau Desktop y Tableau Prep(El enlace se abre en una ventana nueva). También puede descargar las versiones de prueba gratuitas de Tableau Prep(El enlace se abre en una ventana nueva) y Tableau Desktop(El enlace se abre en una ventana nueva).

El conjunto de datos es el resultado del libro de trabajo Driver Infractions.tflx, tal y como se ha creado en la primera fase.

Análisis en Tableau Desktop

Ahora que tenemos los datos configurados, los vamos a trasladar a Tableau Desktop. Algunas de las preguntas son fáciles de responder, pero hay otras que implican algunos (o muchos) cálculos. Pruebe con las siguientes preguntas; puede desplegarlas para obtener información básica sobre cómo proceder si se atasca.

Nota: puede descargar el libro de trabajo Driver Infractions.twbx(El enlace se abre en una ventana nueva) para consultar las soluciones en contexto. Tenga presente que puede haber métodos alternativos de interpretar el análisis o de debatir las respuestas.

1. ¿Cuántos días transcurrieron entre la primera y la segunda infracción de cada conductor?
2. Compare los importes de las multas correspondientes a la primera y a la segunda infracción. ¿Existe alguna correlación entre ellos?
3. En total, ¿qué conductor pagó más? ¿Quién pagó menos?
4. ¿Cuántos conductores cometieron varios tipos de infracciones?
5. ¿Cuál fue el importe de multa medio de los conductores que nunca habían asistido a un curso de seguridad vial?

Ir más allá: datos de tabla dinámica

Si bien los datos con los que hemos estado trabajando están bien estructurados para abordar preguntas de forma concreta en torno a las infracciones primera y segunda, no es la estructura estándar recomendada para utilizar con Tableau Desktop. Cuanto más diverja nuestro análisis de las preguntas básicas en torno a las fechas de las infracciones, más complejos serán nuestros cálculos para combinar la información relevante de modo que se pueda utilizar.

Generalmente, cuando los datos se almacenan con varias columnas para el mismo tipo de datos (por ejemplo, dos columnas para la fecha, dos columnas para el importe de las multas, etc.) y la información única se almacena en el nombre de campo (por ejemplo, si es la primera o la segunda infracción), es un indicio de que los datos deben ser de tabla dinámica.

Este caso se puede manejar muy bien creando una tabla dinámica múltiple en Tableau Prep Builder. Podemos trabajar desde el final del flujo de Tableau Prep de Infracción de conductor creado en el tutorial anterior Buscar la segunda fecha con Tableau Prep.

Consejo: Asegúrese de que vuelve a usar Tableau Prep para realizar los pasos siguientes.

  1. En el paso de limpieza final, añada un paso Tabla dinámica que cree una tabla dinámica por cada campo duplicado. Utilice el icono más situado en la esquina superior derecha del área Campos de tabla dinámica para añadir más Valores de tabla dinámica. Se debe crear una tabla dinámica conjunta para cada conjunto de campos (por ejemplo, Importe de la 1.ª multa e Importe de la 2.ª multa).

    Para obtener más información sobre las tablas dinámicas, consulte Limpiar datos y darles forma.

  2. En el área Campos de tabla dinámica, en la columna Nombres de tabla dinámica1, haga doble clic en cada valor y cambie el nombre a 1º y 2º.

    Panel de configuración de pivote 1 en Tableau Prep que muestra los cinco pivotes

Los resultados se pueden ordenar eliminando las fechas nulas, así como reordenando los campos y cambiando su nombre.

  1. Añada un paso de limpieza después de la tabla dinámica. En la columna Fecha de la infracción, haga clic con el botón derecho en la barra de valores nulos y seleccione Excluir.

  2. Haga doble clic en el nombre de campo Nombres de tabla dinámica 1 y cámbielo por Número de infracción.

  3. Arrastre los campos según convenga para reordenarlos así:

    Vista previa de los datos pivotados y limpios

  1. En los nuevos datos de tabla dinámica, cree una salida llamada Infracciones de conductores de tabla dinámica y trasládela a Tableau Desktop (no olvide ejecutar el flujo después de añadir el paso Salida).

Ahora podemos volver a ver nuestras cinco preguntas con esta estructura de datos de tabla dinámica; puede desplegarlas para obtener información básica sobre cómo proceder si se atasca.

Nota: puede descargar el archivo de flujo completo Pivoted Driver Infractions.tflx para echar un vistazo al trabajo o bien puede descargar el libro de trabajo Pivoted Driver Infractions.twbx para consultar las soluciones en contexto. Tenga presente que puede haber métodos alternativos de interpretar el análisis o de debatir las respuestas.

1. ¿Cuántos días transcurrieron entre la primera y la segunda infracción de cada conductor?
2. Compare los importes de las multas correspondientes a la primera y a la segunda infracción. ¿Existe alguna correlación entre ellos?
3. En total, ¿qué conductor pagó más? ¿Quién pagó menos?
4. ¿Cuántos conductores cometieron varios tipos de infracciones?
5. ¿Cuál fue el importe de multa medio de los conductores que nunca habían asistido a un curso de seguridad vial?

Ventajas de los datos de tabla dinámica

Podríamos quedarnos con la estructura de datos original del tutorial si sabemos que solo tendríamos que responder a preguntas que son fáciles de responder con esa estructura. Sin embargo, el formato de datos de tabla dinámica es más flexible. A pesar de que requiere hacer algunos cálculos, una vez aplicados, el conjunto de datos resultante es adecuado para responder a preguntas más amplias.

Ir aún más allá: solo cálculos

¿Qué pasa si no tiene acceso a Tableau Prep Builder? ¿Está gafado si se ha quedado atascado con los datos originales? ¡Para nada!

Tableau Desktop y las expresiones LOD pueden responder a todas nuestras preguntas analíticas. Si nos conectamos al archivo Traffic Violations.xlsx(El enlace se abre en una ventana nueva) original, se parece mucho al conjunto de datos de tabla dinámica: lo único que no tiene es el campo esencial Número de infracción. Tendremos que imitar el resultado de los pasos de agregación mediante expresiones LOD.

Nota: puede descargar el libro de trabajo LOD Driver Infractions.twbx(El enlace se abre en una ventana nueva) para consultar las soluciones en contexto. Tenga presente que puede haber métodos alternativos de interpretar el análisis o de debatir las respuestas.

1. ¿Cuántos días transcurrieron entre la primera y la segunda infracción de cada conductor?
2. Compare los importes de las multas correspondientes a la primera y a la segunda infracción. ¿Existe alguna correlación entre ellos?
3. En total, ¿qué conductor pagó más? ¿Quién pagó menos?
4. ¿Cuántos conductores cometieron varios tipos de infracciones?
5. ¿Cuál fue el importe de multa medio de los conductores que nunca habían asistido a un curso de seguridad vial?

Es importante recordar que esta solución tiene muchos cálculos anidados y expresiones LOD. Dependiendo del tamaño del conjunto de datos y la complejidad de los datos, el rendimiento podría ser un problema.

Reflexión sobre los métodos

Entonces, ¿qué ruta debe seguir? Eso dependerá completamente de usted y de las herramientas que tenga a su disposición.

  • Si quiere alejarse de las expresiones LOD, existe una solución de configuración de datos, aunque es posible que deba hacer cálculos para algunos análisis (Análisis en Tableau Desktop).

  • Si puede dar forma a los datos y está familiarizado con los cálculos (así como con las expresiones LOD), la opción intermedia ofrece la mejor flexibilidad (Ir más allá: datos de tabla dinámica).

  • Si está familiarizado con las expresiones LOD, hay un impacto mínimo en el rendimiento o no tiene acceso a Tableau Prep, resolverlo solo con expresiones LOD es una opción viable (Ir aún más allá: solo cálculos).

Como mínimo, es útil saber cómo están interrelacionadas la agregación en Tableau Prep y las expresiones de nivel de detalle en Tableau Desktop y cómo afectan al análisis de datos. Como en la mayoría de las cosas en Tableau, hay más de una forma de hacer algo. Explorar todas las opciones le puede ayudar a agrupar conceptos y facilitarle la elección de la mejor solución para usted.

Cálculos utilizados:

Nota: damos las gracias especialmente a Ann Jackson por el tema Do Customers Spend More on Their First or Second Purchase?(El enlace se abre en una ventana nueva) (¿Los clientes gastan más en la primera o en la segunda compra?) de Workout Wednesday y a Andy Kriebel por el consejo de Tableau Prep Returning the First and Second Purchase Dates(El enlace se abre en una ventana nueva) (Indicar la primera y la segunda fecha de compra), que han servido de inspiración para este tutorial. Al hacer clic en estos enlaces, saldrá del sitio web de Tableau. Tableau no asume responsabilidad alguna por la exactitud de las páginas de las que se encargan los proveedores externos ni garantiza que estén actualizadas. Póngase en contacto con los propietarios si tiene alguna pregunta relacionada con su contenido.