Noções básicas sobre os termos do Salesforce e Data Cloud

A partir de 14 de outubro de 2025, o Data Cloud foi renomeado como Data 360. Durante essa transição, você pode ver referências a Data Cloud em nosso aplicativo e documentação. Embora o nome seja novo, a funcionalidade e o conteúdo permanecem inalterados.

À medida que o Tableau Next e Tableau(O link abre em nova janela) continuam a criar integrações mais fortes, adicionamos a capacidade de fazer análises onde você deseja, independentemente de onde seus dados estejam. Isso significa que a terminologia e filosofias do Tableau e Data Cloud estão começando a se aproximar mais. Os usuários que estão familiarizados com um ecossistema podem achar o outro ecossistema confuso ou estranho, mas, no final das contas, tudo se resume a dados.

Este tópico destina-se a orientar os usuários independentemente de qual sistema eles estão acostumados ou em que estão trabalhando.

Observação: anteriormente, o Data 360 era “Data Cloud”.

Conceitos e termos de dados essenciais

Há muitas palavras para descrever os dados. No sentido mais genérico, um conjunto de dados é a coleta de dados com os quais você está trabalhando.

  • Um banco de dados é a plataforma de tecnologia que realmente contém os dados, como Amazon Redshift, Firebird, Planilhas Google ou Oracle.
  • Os dados geralmente são armazenados como uma tabela de dados. Em um banco de dados, pode haver várias tabelas ou exibições. No Excel ou nas Planilhas Google, cada guia de planilha é uma tabela. Em um arquivo csv, o arquivo inteiro é a tabela.
  • Se os dados necessários estiverem espalhados por várias tabelas, eles precisarão estar conectados em um modelo de dados. Um modelo de dados é a representação abstrata de como as tabelas estão conectadas umas às outras.

Dados no Salesforce

No Data 360, os dados são divididos em diferentes conceitos.

Tipo de dadosDescrição
Fluxo de dados(O link abre em nova janela)

As informações de conexão, como a fonte original (S3, Amazon, Google BigQuery etc), bem como quais campos são trazidos, qual campo é a chave primária, com que frequência os dados são atualizados etc.

Objeto de data lake (DLO)(O link abre em nova janela)

Dados ingeridos no Data 360 ou referenciados de um sistema externo, como o Snowflake, são armazenados em um DLO. Os dados armazenados em um DLO são limpos, transformados e preparados para computação e análise.

Cada tabela de dados é seu próprio DLO.

Objeto de modelo de dados (DMO)(O link abre em nova janela)

Um objeto do Data 360 que descreve a estrutura e o esquema de dados armazenados em um ou mais objetos de data lake. Um DMO é uma tabela de dados, mas pode vir de um ou mais DLOs. O DMO recebe os dados DLO e os mapeia em um formato confiável. Conjuntos de regras da resolução de identidade e outras formatações modeladas são aplicadas no DMO. Existem DMOs padrão e personalizados.

O mapeamento de dados(O link abre em nova janela) de um DLO para um DMO e a natureza modelada da maioria dos DMOs é o potencial de harmonização do Data 360.

Objeto de informação calculada (CIO)(O link abre em nova janela)Um objeto de modelo de dados criado após uma informação calculada é processado. As informações calculadas ajudam a criar métricas no estilo cubo com medidas e dimensões nos dados do Data 360. Você pode se conectar a um CIO existente no Data 360 e adicioná-lo como um ativo de dados em seu espaço de trabalho.
Valor separado por vírgula (CSV)(O link abre em nova janela)

Um arquivo de texto que armazena dados em um formato semelhante a uma tabela. Os arquivos CSV são comumente usados para mover dados entre aplicativos e programas.

Para Tableau Next: um arquivo CSV pode ser trazido para um espaço de trabalho do Tableau Next, e os dados podem ser carregados e armazenados no Data 360 como um DLO.

Uma observação sobre os objetos de dados do Salesforce para o público do Tableau

O fluxo de dados são as informações de conexão.

O DLO é o despejo de dados não processados do fluxo de dados. Cada DLO é uma tabela única.

Um DMO não tem analógico direto no Tableau. Um DMO pode ser mapeado a partir de vários DLOs (semelhante a uma "exibição" em um banco de dados), e cada DMO é uma única tabela.

Um CIO não tem analógico no Tableau onde os cálculos são simplesmente campos na fonte de dados como qualquer outra.

Dados no Tableau

Uma fonte de dados(O link abre em nova janela) do Tableau consiste em informações de conexão de banco de dados, no modelo de dados, em informações sobre como acessar os dados (credenciais de acesso etc.) ou atualizá-los, em informações semânticas e, possivelmente, até mesmo nos próprios dados. Os dois principais elementos da interface do usuário para criar e editar uma fonte de dados são a guia Fonte de dados e o painel Dados.

Guia Fonte de dados: a guia Fonte de dados é onde as conexões de dados são estabelecidas com o banco de dados ou arquivos subjacentes, e o modelo de dados é criado combinando tabelas de um ou mais bancos de dados em uma única fonte de dados usando relacionamentos, uniões de colunas e uniões de linhas(O link abre em nova janela). Se os dados forem deixados em seu banco de dados original, será uma conexão em tempo real. Uma cópia dos dados também pode ser trazida para o próprio Tableau como uma extração que pode ser atualizada, se desejado.

Painel Dados: o painel Dados é onde as informações semânticas são capturadas, incluindo nomes de campo, aliases de membro, hierarquias, grupos, conjuntos, cálculos, agregações e cores padrão e descrições de campo.

Fonte de dados: juntas, as modificações feitas na guia de fonte de dados e no painel Dados formam a fonte de dados. Uma fonte de dados pode ser um ativo publicado, um arquivo ou contida na pasta de trabalho em que foi criada.

  • Uma fonte de dados publicada (PDS) é um ativo autônomo no Tableau Cloud ou Tableau Server.
  • Localmente, você também pode ter versões baseadas em arquivo de uma fonte de dados do Tableau:
    • .tds é a extensão de arquivo de uma fonte de dados do Tableau, que contém as informações que não são de dados (conexão e semântica sozinhas).
    • .tdsx é a extensão de arquivo de uma fonte de dados do Tableau em pacote, que contém as informações que não são dados, bem como os próprios dados.
    • .hyper é a extensão de arquivo de uma extração (anteriormente .tde), que contém uma cópia dos dados (os próprios dados).

Observação: uma fonte de dados publicada é o equivalente mais próximo que o Tableau tem de uma camada semântica ou um modelo semântico.

Um observação sobre dados do Tableau para o público do Salesforce

O Tableau trabalha com dados de uma ampla variedade de bancos de dados e tecnologias, locais e baseados na nuvem. Como os dados não vêm de uma nuvem do Salesforce com todos os objetos de dados específicos implicados, há muita flexibilidade na forma de modelar e formatar dados e não existe um conceito real de formatos de dados modelados.

A padronização e os modelos semânticos são, em sua maioria, capturados com fontes de dados publicadas (PDS).

Noções básicas de semântica de dados

  • Dados são os fatos brutos (números, observações e medições).
  • Informação é a interpretação desses dados ou o conhecimento proveniente do processamento e da compreensão dos dados.
  • Semântica é o ponto de partida entre os dados subjacentes e as informações que são geradas a partir deles.

O termo vem do conceito linguístico de semântica versus sintaxe. Sintaxe é como você diz algo; semântica é o que isso significa. Esse conceito de semântica é o que isso significa se aplica à semântica no contexto dos dados. A semântica abrange a forma como as tabelas são combinadas no modelo de dados, informações sobre os campos ou as colunas de dados e como eles podem interagir entre si, informações adicionais como agregação padrão e cálculos realizados sobre os dados brutos.

Um conjunto de dados pode ter todas as informações de que você precisa, mas se você não conseguir descobrir como extrair significado dele, ele será inútil(O link abre em nova janela). Precisa de semântica para ser útil.

O caso de uso comercial não pode ser separado dos detalhes da semântica. A semântica é a descrição dos dados ou seu contexto de negócios. A semântica pode ser dividida em categorias, como modelagem de dados; metadados e descrições de campo; agregações padrão; hierarquias, grupos e conjuntos; e cálculos.

Alguns exemplos:

  • Modelagem de dados
    • Como as tabelas de dados podem se conectar umas às outras. As quatro tabelas de vendas trimestrais devem ter uma união de linhas? A tabela de médicos deve estar diretamente relacionada à tabela de pacientes, ou ambas devem estar relacionadas à tabela de consultas?
  • Metadados de campo (nome do campo, tipo de dados, aliases de membro)
    • Nome é o nome de uma conta ou contato?
    • Desconto é um campo booleano para a aplicação ou não de um desconto, um campo de cadeia de caracteres do tipo de desconto ou uma medida discreta do valor do desconto?
  • Descrição de campo
    • Por exemplo, um comentário informando que APR para esse conjunto de dados é Adjusted Pitching Runs, e não Annual Percent Return, e é calculado como APR = L * IP - R / pf(P) em que L: número médio de corridas por entrada arremessada na liga, IP: entradas arremessadas, R: corridas permitidas, pf(P): fator de parque para o parque residencial do jogador P.
  • Agregações padrão
    • As listagens devem ser agregadas como COUNT (contando cada instância) ou COUNTD (contando apenas valores exclusivos)?
    • A agregação padrão de uma medida deve ser SUM ou AVG?
  • Hierarquias, conjuntos, grupos
    • Em uma coleção de departamentos em uma universidade, o departamento de engenharia pode ser sua própria faculdade, onde os departamentos de história, literatura, filosofia e ciência política podem formar a faculdade de Artes Liberais.
  • Cálculos
    • Campos derivados de campos que existem nativamente nos dados, mas que precisam ser manipulados ou combinados, como definir um caso de suporte obsoleto como aquele que está aberto há 10 dias para uma conta padrão, mas apenas 2 dias para uma conta premium.

Semântica no Tableau e Semântica do Tableau

Sem uma camada semântica reutilizável, modelos de dados, definições semânticas e campos calculados podem criados como singularidades repetidamente, introduzindo ineficiências e o potencial de erro ou desalinhamento.

Semântica no Tableau

A semântica não é novidade para o público do Tableau. Ela foi apenas parte da fonte de dados — especialmente uma fonte de dados publicada (PDS). A fonte de dados publicada é onde você controla as definições semânticas dos seus dados.

Por causa da filosofia do Tableau do ciclo da análise visual(O link abre em nova janela), a semântica historicamente não foi abstraída em uma camada distinta. O ambiente de criação é o local onde o modelo de dados (a guia Fonte de dados) e a semântica (o painel Dados) são desenvolvidos juntos.

Semântica do Tableau

Semântica do Tableau(O link abre em nova janela), adota a abordagem de separar a semântica em uma camada distinta da análise para que os modelos semânticos possam ser criados uma vez e usados em uma variedade de análises ou até mesmo produtos. A Semântica do Tableau se encaixa nos ambientes do Data 360 e Tableau Next como uma camada semântica autônoma distinta dos dados ou da análise. A unidade da camada semântica é um modelo semântico. O modelo semântico contém o modelo de dados e as definições semânticas dos dados. Na Semântica do Tableau, o Criador de modelo semântico é a interface do usuário para criar um modelo semântico. Esses modelos semânticos podem ser criados no Data 360 ou Tableau Next.

Interoperabilidade

Com o conector da Semântica do Tableau para Tableau, você pode fazer análises no Tableau usando um modelo semântico do Tableau Next. Ou, ao criar um modelo semântico a partir de uma fonte de dados publicada (PDS)(O link abre em nova janela), você pode fazer análises no Tableau Next usando uma fonte de dados do Tableau.

Agradecemos seu feedback!Seu feedback foi enviado. Obrigado!