Examinar datos

Utilice las opciones de este tema para entender mejor la composición de sus datos, los cambios que debe hacer y el efecto de las operaciones incluidas en el flujo.

Revisar los tipos de datos asignados a los datos

Al igual que Tableau Desktop, Tableau Prep Builder interpreta los datos de los campos cuando arrastra una conexión al panel de flujo y le asigna un tipo de datos automáticamente. Dado que distintas bases de datos pueden manipular los datos de diferentes maneras, la interpretación de Tableau Prep Builder podría no ser siempre la correcta.

Para cambiar un tipo de datos, haga clic en el icono del tipo de datos y seleccione el tipo de datos correcto en el menú contextual. También puede cambiar los tipos de datos de cadena o entero a fecha (o a fecha y hora). En ese caso, Tableau Prep Builder activará el análisis automático de fechas (DateParse) para cambiar estos tipos de datos. Al igual que en Tableau Desktop, si los cambios no se han realizado correctamente, verá valores nulos en los campos y podrá crear un cálculo para realizar el cambio.

Para obtener más información sobre la funcionalidad DateParse, consulte Convertir un campo en un campo de fecha en la ayuda de Tableau Desktop y de la creación web.

Ver detalles del tamaño de sus datos

Tras conectar los datos, añada una tabla al flujo y, a continuación, añada un paso. Puede utilizar el panel Perfil para ver el estado actual y estructurar los datos y detectar nulos y valores atípicos.

  • Número de campos y columnas: en la esquina superior izquierda del panel de perfil encontrará información que resume el número de campos y filas que hay en los datos en un punto concreto del flujo. Tableau Prep Builder redondea al millar más cercano. En el ejemplo siguiente, hay 21 campos y 3000 filas en el conjunto de datos.

    Si sitúa cursor sobre el número de campos y filas, verá el número exacto de filas (en este ejemplo, 2848):


  • Tamaño del conjunto de datos: para trabajar con un subconjunto de los datos, especifique el número de filas que se deben incluir en la pestaña Muestra del panel Entrada.

  • Muestreado: para que pueda interactuar directamente con los datos, Tableau Prep Builder trabaja con un subconjunto de los datos sin procesar. El número de filas está determinado por los tipos de datos y el número de campos representados. Los campos de cadena ocupan más espacio de almacenamiento que los campos de enteros, de modo que, si tiene 10 campos de cadena en su conjunto de datos, podría obtener menos filas que si tuviera 10 campos de números enteros. Un indicador Muestreado aparece junto a los detalles del tamaño en el panel de perfil para indicar que se trata de un subconjunto de los datos. Para obtener más información sobre las muestras de datos, consulte Configurar el conjunto de datos.

  • Número de valores únicos: el número que aparece junto a cada encabezado de campo representa los valores únicos que hay en ese campo. Tableau Prep Builder redondea al millar más cercano. En el ejemplo siguiente, hay 3000 valores únicos representados en el campo Descripción, pero, si sitúa el cursor sobre el número, verá el número exacto de valores únicos.



Ver la distribución de los valores o los valores únicos

De forma predeterminada, Tableau Prep Builder agrupa valores numéricos, de fecha, y de fecha y hora de un campo en contenedores. Estos contenedores también se denominan agrupaciones. Estas agrupaciones garantizan que pueda ver la distribución de los valores en su conjunto, e identificar rápidamente valores atípicos y nulos. El tamaño de la agrupación se calcula en función de los valores mínimos y máximos del campo, y los valores nulos siempre aparecen en la parte superior de la distribución.

Por ejemplo, las fechas de pedido y de envío se resumen o "agrupan" por año. Cada agrupación representa un año desde enero del año que comienza hasta enero del año siguiente, y se etiqueta como corresponde. Dado que hay fechas de ventas y fechas de envío de finales de 2018 y 2019, se crea una agrupación para el siguiente año para esos valores.

Si un campo de datos discreto (o de categoría) contiene muchas filas o su distribución es tan grande que no puede mostrarse en el campo sin desplazarse, verá una distribución resumida a la derecha del campo. Haga clic y desplácese por la distribución para seleccionar valores específicos.

Si los datos contienen campos numéricos o de fecha, puede activar o desactivar la visualización de la versión detallada (discreta) o resumida (continua) de los valores. La vista resumida muestra el intervalo de valores en un campo y la frecuencia de aparición de determinados valores.

Activar y desactivar esta vista puede ayudarle a aislar valores únicos (por ejemplo, el número de registros con valor "3" en un campo) o la distribución de los valores (por ejemplo, la suma de todos los registros con valor "3" en un campo).

Para activar o desactivar la vista:

  1. En el panel Perfil, en el panel Resultados o en la cuadrícula de datos, haga clic en el menú Más opciones de un campo de datos o numérico.

  2. En el menú contextual, seleccione Detalle para ver una versión detallada de los valores, o Resumen para ver la versión distribuida.

Buscar campos y valores

En el panel Perfil o en el panel Resultados puede buscar campos o valores en los que tenga un interés particular y usar los resultados de búsqueda para filtrar los datos.

Para buscar campos, escriba un término de búsqueda completo o parcial en el cuadro de búsqueda de la barra de herramientas.

Para buscar un valor en un campo:

  1. Haga clic en el icono de búsqueda de un campo y escriba un valor.

  2. Para usar las opciones de búsqueda avanzada, haga clic en el botón Opciones de búsqueda....

  3. Para usar los resultados de búsqueda con el fin de filtrar los datos, seleccione Mantener solamente o Excluir.

    En el panel Flujo aparece un icono de filtro sobre los pasos en cuestión.

Ordenar valores y campos

Las opciones de orden de una tarjeta de perfil le permiten ordenar las agrupaciones (el número de valores representados por las barras de distribución) en orden ascendente o descendente, u ordenar los valores de campo individuales alfabéticamente.

Si desea reorganizar el orden de los campos, seleccione un campo o una tarjeta de perfil en el panel Perfil, en el panel Resultados o en la cuadrícula de datos y arrástrelo hasta que aparezca la línea de destino negra. A continuación, suéltelo. El panel de perfil y la cuadrícula de datos están sincronizados para que el campo aparezca en el mismo orden en ambos lugares.

Resaltar campos y valores en un flujo

Tableau Prep Builder hace que sea más fácil buscar campos y valores en los datos de su flujo. Localice el lugar donde se ha originado un campo y donde se usa en todo el flujo en el panel del flujo, o bien haga clic en valores concretos de una tarjeta de perfil o en la cuadrícula de datos para resaltar valores idénticos o relacionados.

Localizar campos en un flujo

En la versión 2018.3.3 de Tableau Prep Builder o superior, puede resaltar todos los lugares en que se use un campo en un flujo, incluso el lugar en que se originó para ayudarle a localizar varios perdidos o a solucionar problemas relacionados con un flujo cuando no vea los resultados que espera.

Haga clic en un campo del panel Perfil en un paso de limpieza o en el panel Resultados en cualquier otro tipo de pasos y el panel de flujo destacará la ruta en la que se usa el campo.

Nota: Esta opción no está disponible para los tipos de pasos Entrada y Salida.

Ver valores relacionados

Puede resaltar valores relacionados para encontrarlos en campos distintos. Si hace clic en un valor en la tarjeta Perfil del panel Perfil o del panel Resultados, todos los valores relacionados en los demás campos se resaltarán en azul. El color azul indica la distribución de la relación entre el valor seleccionado y los valores en otros campos.

Por ejemplo: para resaltar los valores relacionados, haga clic en el valor de un campo en el panel de perfil. Los valores relacionados en otros campos adquieren un color azul y la proporción de la barra resaltada en azul representa el grado de asociación.

Resaltar valores idénticos

Si selecciona un valor en la cuadrícula de datos, también se resaltan todos los valores idénticos. Este resaltado le ayudará a identificar patrones o irregularidades en los datos.

Otros artículos de esta sección

¡Gracias por sus comentarios! Se produjo un error al enviar sus comentarios. Vuelva a intentarlo o escríbanos.