Comprender los términos de Salesforce y Data Cloud

A medida que Tableau Next y Tableau(El enlace se abre en una ventana nueva) continúan construyendo integraciones más sólidas, estamos agregando la capacidad de realizar análisis donde usted quiera, independientemente de dónde se encuentren sus datos. Esto significa que la terminología y las filosofías de Tableau y Data Cloud están empezando a acercarse más y más. Los usuarios que están familiarizados con un ecosistema pueden encontrar el otro ecosistema confuso o extraño, pero todo son datos.

Este tema pretende ayudar a orientar a los usuarios, independientemente del sistema al que estén acostumbrados o en el que trabajen.

Términos y conceptos esenciales de los datos

Hay muchas palabras para describir los datos. En el sentido más genérico, un conjunto de datos es el compendio de datos con los que trabaja.

  • Una base de datos es la plataforma tecnológica que realmente contiene los datos, como Amazon Redshift, Firebird, Google Sheets u Oracle.
  • A menudo, los datos se almacenan como una tabla de datos. En una base de datos, puede haber varias tablas o vistas. En Excel u Hojas de cálculo de Google, cada pestaña de la hoja es una tabla. En un archivo CSV, el archivo completo es la tabla.
  • Si los datos que necesita están repartidos en varias tablas, deben estar conectados en un modelo de datos. Un modelo de datos es la representación abstracta de cómo se conectan las tablas entre sí.

Datos en Salesforce

En Data Cloud, los datos se dividen en diferentes conceptos.

Tipos de datosDescripción
Flujo de datos(El enlace se abre en una ventana nueva)

La información de conexión, como la fuente original (S3, Amazon, Google BigQuery, etc.), así como qué campos se incluyen, qué campo es la clave principal, con qué frecuencia se actualizan los datos, etc.

Objeto de lago de datos (DLO)(El enlace se abre en una ventana nueva)

Los datos importados en Data Cloud o referenciados desde un sistema externo como Snowflake se almacenan en un DLO. Los datos almacenados en un DLO se limpian, transforman y preparan para su cálculo y análisis.

Cada tabla de datos es su propio DLO.

Objeto de modelo de datos (DMO)(El enlace se abre en una ventana nueva)

Un objeto de Data Cloud que describe la estructura y el esquema de los datos almacenados en uno o más objetos de mar de datos. Un DMO es una tabla de datos, pero puede provenir de uno o más DLO. El DMO toma los datos del DLO y los asigna a un formato confiable. Los conjuntos de reglas de resolución de identidades y otros formatos de plantillas se aplican en el DMO. Hay DMO estándar y personalizados.

El mapeo de datos(El enlace se abre en una ventana nueva) de un DLO a un DMO y la naturaleza de plantillas de la mayoría de los DMO es el poder de armonización de Data Cloud.

Objeto de perspectiva calculada (CIO)(El enlace se abre en una ventana nueva)Un objeto de modelo de datos creado después de procesar una perspectiva calculada. La perspectiva calculada ayuda a crear métricas de tipo cubo con medidas y dimensiones en los datos de Data Cloud. Puede conectarse a un CIO existente en Data Cloud y agregarlo como un recurso de datos en su espacio de trabajo.
Valores separados por comas (CSV)(El enlace se abre en una ventana nueva)

Archivo de texto que almacena datos en un formato similar a una tabla. Los archivos CSV se utilizan comúnmente para mover datos entre aplicaciones y programas.

Para Tableau Next: Se puede transferir un archivo CSV a un espacio de trabajo de Tableau Next y cargar y almacenar los datos en Data Cloud como un DLO.

Un aparte sobre los objetos de datos de Salesforce para la audiencia de Tableau

El flujo de datos es la información de conexión.

El DLO es el volcado de datos sin procesar del flujo de datos. Cada DLO es una sola tabla.

Un DMO no tiene un análogo directo en Tableau. Un DMO se puede asignar a partir de varios DLO (similar a una “vista” en una base de datos) y cada DMO es una sola tabla.

Un CIO no tiene un análogo en Tableau, donde los cálculos son simplemente campos en la fuente de datos como cualquier otro.

Datos en Tableau

Una fuente de datos(El enlace se abre en una ventana nueva) de Tableau consta de información de conexión de base de datos, el modelo de datos, información sobre cómo acceder a los datos (credenciales de acceso, etc.) o actualizarlos, información semántica e incluso los datos mismos. Los dos elementos principales de la interfaz de usuario para crear y editar una fuente de datos son la pestaña de fuente de datos y el panel Datos.

Pestaña Fuentes de datos: La pestaña Fuente de datos es donde se establecen las conexiones de datos a la base de datos o archivos subyacentes y el modelo de datos se construye combinando tablas de una o más bases de datos en una única fuente de datos usando relaciones, uniones de filas y columnas(El enlace se abre en una ventana nueva). Si los datos se dejan en su base de datos original, es una conexión en tiempo real. Una copia de los datos también puede incorporarse a Tableau como un extracto que se puede actualizar si se desea.

Panel Datos: El panel Datos es donde se captura la información semántica, incluidos los nombres de campo, los alias de miembros, las jerarquías, los grupos, los conjuntos, los cálculos, las agregaciones y colores predeterminados y las descripciones de los campos.

Fuente de datos: Juntas, las modificaciones realizadas en la pestaña Fuente de datos y en el panel Datos forman la fuente de datos. Una fuente de datos puede ser un recurso publicado, un archivo o estar incluida en el libro de trabajo en el que se creó.

  • Una fuente de datos publicada (PDS) es un recurso independiente en Tableau Cloud o Tableau Server.
  • A nivel local, también puede tener versiones basadas en archivos de una fuente de datos de Tableau:
    • .tds es la extensión de archivo de una fuente de datos de Tableau que contiene la información que no es de datos (solo conexión y semántica).
    • .tdsx es la extensión de archivo de una fuente de datos de Tableau empaquetada, que contiene información que no es de datos, además de los datos en sí.
    • .hyper es la extensión de archivo de una extracción (anteriormente .tde), que contiene una copia de los datos (los datos en sí).

Nota: Una fuente de datos publicada es el equivalente más cercano que tiene Tableau a una capa semántica o modelo semántico.

Un aparte sobre los datos de Tableau para la audiencia de Salesforce

Tableau trabaja con datos de una amplia variedad de bases de datos y tecnologías, tanto locales como basadas en la nube. Debido a que los datos no provienen de una nube de Salesforce con todos los objetos de datos específicos que eso implica, hay muchas posibilidades de modelar y aplicar formato a los datos, y no existe un concepto real de formatos de datos con plantillas.

La estandarización y los modelos semánticos se capturan principalmente con fuentes de datos publicadas (PDS).

Fundamentos de la semántica de datos

  • Los datos son los hechos en bruto (números, observaciones y mediciones).
  • La información es la interpretación de esos datos o el conocimiento que proviene del procesamiento y comprensión de los datos.
  • La semántica es el trampolín entre los datos subyacentes y la información que surge de ellos.

El término proviene del concepto lingüístico de semántica vs sintaxis. La sintaxis es cómo se dice algo, la semántica es lo que significa. Ese concepto de semántica es lo que significa se traslada a la semántica en el contexto de los datos. La semántica incluye aspectos como la forma en que se combinan las tablas en el modelo de datos, información sobre los campos o columnas de datos y cómo pueden interactuar entre sí, información adicional como la agregación predeterminada y los cálculos realizados sobre los datos sin procesar.

Un conjunto de datos puede tener toda la información que necesita, pero si no puede averiguar cómo obtener significado de él, es inútil(El enlace se abre en una ventana nueva). Necesita semántica para ser útil.

El caso de uso empresarial no puede separarse de los detalles de la semántica. La semántica es la descripción de los datos o su contexto empresarial. La semántica se puede desglosar en categorías, como modelado de datos; metadatos y descripciones de los campos; agregaciones predeterminadas; jerarquías, grupos y conjuntos; y cálculos.

Algunos ejemplos:

  • Modelado de datos
    • Cómo se pueden conectar las tablas de datos entre sí. ¿Se deben unir las cuatro tablas de ventas trimestrales? ¿La tabla de médicos debe estar directamente relacionada con la tabla de pacientes o ambas deben estar relacionadas con la tabla de citas?
  • Metadatos del campo (nombre de campo, tipo de datos, alias de miembros)
    • ¿Nombre es el nombre de una cuenta o de un contacto?
    • ¿Descuento es un campo booleano para indicar si se aplica o no un descuento, un campo de cadena del tipo de descuento o una medida discreta del importe del descuento?
  • Descripciones del campo
    • Por ejemplo, un comentario de que la APR para este conjunto de datos es Carreras de pitcheo ajustadas, no Rendimiento porcentual anual, y se calcula como APR = L * IP - R / pf(P) donde L: Número promedio de carreras por entrada lanzadas en la liga, IP: Entradas lanzadas, R: Carreras permitidas, pf(P): factor de parque para el parque local del jugador P.
  • Agregaciones predeterminadas
    • ¿Deben agregarse los listados como COUNT (contando todas las instancias) o COUNTD (contando solo valores únicos)?
    • ¿Debe la agregación predeterminada de una medida ser SUM o AVG?
  • Jerarquías, conjuntos y grupos
    • En un conjunto de departamentos de una universidad, el departamento de ingeniería puede ser su propia facultad, donde los departamentos de historia, literatura, filosofía y ciencias políticas pueden formar la facultad de Artes.
  • cálculos
    • Campos que se derivan de campos que existen de forma nativa en los datos pero que deben manipularse o combinarse, como definir un caso de soporte obsoleto como uno que ha estado abierto durante 10 días para una cuenta estándar pero solo 2 días para una cuenta premium.

Semántica en Tableau y Semántica de Tableau

Sin una capa semántica reutilizable, los modelos de datos, las definiciones semánticas y los campos calculados pueden convertirse en elementos únicos una y otra vez, lo que introduce ineficiencias y la posibilidad de errores o desalineaciones.

Semántica en Tableau

La semántica no es nada nuevo para el público de Tableau. Ha formado parte de la fuente de datos, especialmente de una fuente de datos publicada (PDS). La fuente de datos publicada es donde controla las definiciones semánticas de sus datos.

Debido a la filosofía de Tableau del ciclo del análisis visual(El enlace se abre en una ventana nueva), históricamente, la semántica no se ha abstraído en una capa distinta. El entorno de creación es el lugar donde se desarrollan conjuntamente el modelo de datos (la pestaña Fuente de datos) y la semántica (el panel Datos).

Semántica de Tableau

Semántica de Tableau(El enlace se abre en una ventana nueva) adopta el enfoque de separar la semántica en una capa distinta del análisis, de modo que los modelos semánticos puedan crearse una vez y utilizarse en una variedad de análisis o incluso productos. Semántica de Tableau se adapta a los entornos de Data Cloud y Tableau Next como una capa semántica independiente y distinta de los datos o análisis. La unidad de una capa semántica es un modelo semántico. El modelo semántico contiene tanto el modelo de datos como las definiciones semánticas de los datos. En Semántica de Tableau, el generador de modelos semánticos es la interfaz de usuario para crear un modelo semántico. Estos modelos semánticos se pueden crear en Data Cloud o Tableau Next.

Y con el conector de Semántica de Tableau para Tableau, puede realizar análisis en Tableau utilizando un modelo semántico de Tableau Next.

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!