Consejos para trabajar con datos

Los datos se pueden organizar de diferentes maneras. Para aprovechar las funciones de Tableau Desktop, Tableau le recomienda que se conecte a datos formateados para el análisis. En concreto, a los siguientes tipos de datos:

  • datos que sean lo más granulares posible, en lugar de datos agregados (por ejemplo, datos meteorológicos diarios en lugar de promedios mensuales);

  • datos organizados como una tabla de base de datos (en lugar de una tabla con una orientación de columna, como una tabulación cruzada);

  • datos sin información superflua (todo aquello que no sean los propios datos y sus encabezados).

Cuando los datos se estructuran para el análisis, es mucho más fácil hacer preguntas y responder. Tableau puede agregar datos sin procesar en el nivel deseado sin someterse a las restricciones de las agregaciones ya presentes en los datos. Se pueden crear todos los grupos y las jerarquías que se necesiten, y los cálculos se pueden realizar en el flujo de análisis.

Tableau Desktop cuenta con unas opciones de limpieza básicas y con un intérprete de datos. Tableau Prep puede ser necesario para cuestiones más complejas de formato.

En las siguientes secciones referentes a Tableau Desktop, se resaltan y proporcionan sugerencias para solucionar algunos errores habituales de formato que pueden dificultar el análisis de los datos.

Datos dinámicos en formato de tabulación cruzada

Al dar formato a los datos como en el formato de las tabulaciones cruzadas, la tabla adopta una orientación de columna. En las tablas que tienen esta orientación, las variables se almacenan como encabezados de columna. Sin embargo, Tableau Desktop está optimizado para utilizar datos con una orientación de fila. En las tablas que tienen esta orientación, las variables se almacenan en los valores de fila.

Por ejemplo, imagínese que tiene una tabla con una orientación de columna en la que aparecen las calificaciones de matemáticas, ciencia e historia de alumnos de educación primaria.

Tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar y tres materias escolares (matemáticas, ciencias e historia) de tres estudiantes. Las columnas de asignaturas escolares están resaltadas en naranja pálido.

Tableau Desktop está optimizado para conectarse a tablas con una orientación de fila, en las que los valores de las asignaturas de matemáticas, ciencia e historia están organizados en una columna denominada "Asignatura", mientras que las calificaciones de cada alumno se organizan en una columna denominada "Calificación". Puede pivotar las columnas en las filas editando manualmente los datos de Excel. También puede conectarse a los datos de Excel desde Tableau Desktop y utilizar la opción de pivote. Para obtener más información sobre la opción de pivote, consulte Pivotar datos de columnas a filas.

Ejemplo de tabla dinámica de tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar, la materia de la clase y el puntaje de calificación.

Quitar datos agregados anteriormente

A menudo, los datos pueden estar agregados previamente; es decir, pueden contener sumas, promedios, medianas, etc. Un ejemplo habitual de datos agregados previamente suelen ser los subtotales y los totales generales, cuyos datos se calculan a partir de los datos sin procesar, pero no forman parte de estos datos en cuestión.

Por ejemplo, imagínese que tiene una tabla que contiene una fila de datos de subtotales.

Tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar y tres materias escolares (matemáticas, ciencias e historia) de cinco estudiantes. Hay una fila de subtotales resaltada en naranja pálido en la parte inferior de la tabla que muestra la suma de los puntajes de los estudiantes en cada materia.

En este caso, los datos agregados previamente deben eliminarse. Para utilizar los subtotales y los totales generales en el análisis, elimine manualmente este tipo de información de la tabla. A continuación, conéctese a los datos de Excel desde Tableau Desktop y calcule los subtotales y los totales con la opción de totales. Para obtener más información, consulte Mostrar los totales en una visualización. También puede conectarse a los datos de Excel desde Tableau Desktop, activar el intérprete de datos y utilizar la opción de totales. Para obtener más información, consulte Limpiar datos de Excel, CSV, PDF y Hojas de cálculo de Google con el intérprete de datos.

Tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar y tres materias escolares (matemáticas, ciencias e historia) de cinco estudiantes. Hay una fila de subtotales resaltada en naranja pálido en la parte inferior de la tabla que muestra la suma de los puntajes de los estudiantes en cada materia, y la fila está tachada en rojo.

Quitar o excluir texto introductorio

Los datos de Excel suministrados como informe pueden contener títulos o bloques de texto preliminar. Como Tableau Desktop prevé encabezados de columna o valores de fila en la primera fila de una tabla, esta información puede provocar problemas durante el análisis.

Por ejemplo, imagínese que tiene una tabla que contiene un título y una fecha de un informe.

Ejemplo de tabulación cruzada con detalles en la esquina superior resaltados en naranja pálido que dice "Informe de Excel, enero de 2017".

En este caso, la información del título y de la fecha debe eliminarse. Para utilizar un título y una fecha para un informe, lleve a cabo una de las siguientes acciones:

  • Elimine manualmente esta información de los datos de Excel. A continuación, conéctese a estos datos desde Tableau Desktop y añada un título de informe con la opción de título. Para obtener más información, consulte Dar formato a partes individuales de la vista.
  • Conéctese a los datos de Excel desde Tableau Desktop, active el intérprete de datos y utilice la opción de título. Para obtener más información, consulte Limpiar datos de Excel, CSV, PDF y Hojas de cálculo de Google con el intérprete de datos.
  • Si no puede eliminar esta información de los datos de Excel, cree un intervalo identificado y conéctese a él desde Tableau Desktop. Para obtener más información, consulte Excel.

Ejemplo de tabulación cruzada con detalles innecesarios en la esquina superior tachados en rojo. Estos detalles dicen "Informe de Excel, enero de 2017".

Reducir el ancho de encabezados jerárquicos a una sola fila

Por lo general, Tableau Desktop prevé que solo la primera fila de los datos de Excel contenga encabezados de columna. Los datos que contienen varias capas de encabezados de columna pueden provocar problemas durante el análisis.

Por ejemplo, imagínese que tiene una tabla que contiene un encabezado principal y varios subencabezados.

Tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar y tres materias escolares (matemáticas, ciencias e historia) de cuatro estudiantes. Hay un encabezado de tabla que dice "California" resaltado en naranja pálido en la parte superior de la tabla.

En este caso, la jerarquía de encabezados se debe ajustar o eliminar. Para ello, puede crear manualmente una columna nueva para cada encabezado de la jerarquía directamente en los datos de Excel. También puede conectarse a los datos de Excel desde Tableau Desktop y activar el intérprete de datos. Compruebe que los encabezados estén correctamente ajustados. Para obtener más información sobre el intérprete de datos, consulte Limpiar datos de Excel, CSV, PDF y Hojas de cálculo de Google con el intérprete de datos.

Tabulación cruzada que muestra identificaciones de estudiantes, estados, géneros, escuelas y puntajes de exámenes. La columna Estado está resaltada en verde pálido.

Asegurarse de que no hay celdas en blanco

Si crea columnas nuevas para los encabezados jerárquicos, asegúrese de que todas las celdas de las columnas nuevas contienen valores.

Ejemplo de tabla dinámica de tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar, la materia de la clase y el puntaje de calificación. La columna Estado está resaltada en naranja pálido y, de las diez filas totales de la columna, solo hay texto en ocho.

Aunque repita el mismo valor para cada fila, es importante que cada fila contenga los datos que la asocian a los datos almacenados en el encabezado jerárquico. Debe eliminar manualmente las celdas en blanco de los datos de Excel.

Ejemplo de tabla dinámica de tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar, la materia de la clase y el puntaje de calificación. La columna Estado está resaltada en verde pálido y hay estados poblados en cada una de las diez filas.

Quitar filas en blanco

Asegúrese de que no haya filas en blanco en los datos. Para corregir las filas en blanco, debe eliminarlas de los datos de Excel.

Ejemplo de tabla dinámica de tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar, la materia de la clase y el puntaje de calificación. Hay dos filas en blanco resaltadas en naranja pálido.

Añadir encabezados que faltan

Asegúrese de que todos los encabezados de columna estén presentes. Para corregir esta situación, debe añadirlos manualmente a los datos de Excel.

Ejemplo de tabla dinámica de tabulación cruzada que muestra el número de identificación del estudiante, el género, la región escolar, la materia de la clase y el puntaje de calificación. Hay dos encabezados de columnas en blanco resaltados en naranja pálido.