Tableau Data Management
Este conteúdo faz parte do Tableau Blueprint, uma estrutura de maturidade que permite ampliar e melhorar a forma como sua organização usa dados para gerar impacto. Para começar sua jornada, faça nossa avaliação(O link abre em nova janela).
Com o Tableau Data Management, você pode gerenciar melhor os dados em seu ambiente de análise, garantindo que dados confiáveis e atualizados sempre sejam usados para orientar as decisões. O Tableau Data Management ajuda a aumentar a confiança nos seus dados, acelerando a adoção da análise de autoatendimento, desde a preparação e a catalogação dos dados até a busca e a governança. A oferta consiste em uma coleção licenciada à parte de recursos e funcionalidades individuais, incluindo o Tableau Prep Conductor e o Tableau Catalog, responsáveis por gerenciar o conteúdo e os ativos de dados do Tableau no Tableau Server e no Tableau Cloud.
O que é Tableau Data Management?
No geral, sua organização se beneficiará das abordagens de governança de dados e gerenciamento de fontes de dados discutidas em outras partes do Tableau Blueprint. Além dessas metodologias, você frequentemente ouvirá referências genéricas ao termo gerenciamento de dados nas comunidades de banco de dados, análise de dados e visualização. No entanto, esse termo fica mais específico quando se trata do Tableau com Tableau Data Management, um conjunto de recursos para uso com o Tableau Server e o Tableau Cloud. Independentemente de você estar usando o Tableau Server para Windows ou Linux ou Tableau Cloud, os recursos do Tableau Data Management são praticamente idênticos (um pequeno subconjunto de recursos pode estar disponível apenas no Tableau Cloud ou no Tableau Server).
O Tableau Data Management abrange um conjunto de ferramentas que ajudam os administradores e analistas de dados da sua organização a gerenciar conteúdos e ativos relacionados a dados em seu ambiente Tableau. Especificamente, três conjuntos de recursos adicionais são adicionados quando você adquire o Tableau Data Management:
Tableau Catalog
Tableau Prep Conductor
Conexões virtuais com políticas de dados
Tableau Catalog
O recurso original do Tableau Data Management, o Tableau Catalog, oferece recursos para ajudar a simplificar o acesso, a compreensão e a confiança das fontes de dados do Tableau. Com foco em áreas como linhagem, qualidade de dados, pesquisa e análise de impacto, o Tableau Catalog pode facilitar aos administradores de dados e visualizadores/analistas de dados a compreensão e a confiança nas fontes de dados no Tableau Server e na nuvem. O Tableau Catalog inclui recursos adicionais para desenvolvedores do Tableau por meio de métodos de metadados na API REST do Tableau.
Quando o Tableau Catalog é habilitado inicialmente, ele verifica todos os itens de conteúdo relacionados no seu site do Tableau Server ou Cloud para criar uma exibição conectada de todos os objetos relacionados (o Tableau Catalog se refere a isso como metadados de conteúdo). Isso expande os recursos de pesquisa além das conexões de dados. Administradores de dados e autores visuais também podem pesquisar com base em colunas, bancos de dados e tabelas.
Para reduzir a possibilidade de modificar ou excluir inadvertidamente um objeto do qual outro objeto depende (por exemplo, renomear ou remover uma coluna de banco de dados que é fundamental para uma pasta de trabalho de produção), o recurso de linhagem do Tableau Catalog expõe inter-relações entre todo o conteúdo de um site do Tableau, incluindo métricas, fluxos, conexões virtuais. Agora você pode ver facilmente os relacionamentos entre os objetos e analisar o impacto de uma alteração pendente antes de realizá-la.
Para aumentar a confiança nas fontes de dados do Tableau, o Tableau Catalog fornece informações complementares, como descrições expandidas de objetos relacionados a dados, a exibição Detalhes dos dados e marcas de palavras-chave para maior flexibilidade de pesquisa. A certificação de fontes de dados coloca um ícone em destaque próximo às fontes de dados para indicar a confiança do proprietário da fonte de dados ou do administrador na fonte de dados. Itens de dados (fontes de dados, colunas e assim por diante) que podem ser motivo de preocupação para os consumidores, como dados obsoletos ou obsoletos, podem ser designados com avisos de qualidade de dados. Além de uma opção de aviso de qualidade de dados, os dados confidenciais podem ser sinalizados especificamente com Rótulos de confidencialidade.
Tableau Prep Conductor
Se você é como muitos clientes do Tableau, descobriu os benefícios do Tableau Prep Builder para criar “fluxos” sofisticados de preparação de dados que combinam várias fontes de dados, formatam os dados, personalizam colunas e geram saída em um ou mais formatos de dados desejados. Mas depois de criar o fluxo de preparação perfeito, como automatizá-lo para executar e atualizar total ou incrementalmente as fontes de dados de acordo com um cronograma?
É aqui que entra o Tableau Prep Conductor, outro recurso do gerenciamento de dados. O Tableau Prep Conductor permite o agendamento flexível de fluxos do Tableau Prep, independentemente de eles serem publicados no ambiente do Tableau Server ou do Tableau Cloud no Tableau Prep Builder ou criados diretamente em um navegador com a Criação na Web do Prep Flow. Comece testando seu fluxo baseado na Web (você pode executar fluxos manualmente sob demanda sem o Data Management, mas precisará adquirir o Data Management para agendar fluxos para execução automática com o Prep Conductor). O fluxo deve ser executado até a conclusão e criar a fonte de dados de saída desejada sem erros antes do agendamento.
Se você estiver usando o Tableau Server, seu administrador (ou você, se tiver os privilégios adequados) poderá criar programações personalizadas (como “Diariamente à meia-noite”, “Domingo ao meio-dia” e assim por diante) para executar fluxos de preparação, da mesma forma que você pode ter feito para atualizações de extração.
Se você estiver usando o Tableau Cloud, um conjunto de agendas de fluxo de preparação predefinidas será instalado por padrão. Você não pode personalizá-las ou criar suas próprias agendas de fluxo de preparação.
Agende fluxos para execução no menu Ações. Uma agenda de Tarefa única executará apenas o fluxo de preparação selecionado na agenda selecionada. Uma agenda de Tarefa Vinculada permitirá que você selecione um ou mais fluxos adicionais para serem executados em sequência com o fluxo selecionado, caso deseje “encadear” vários fluxos para serem executados em uma ordem específica (talvez para criar uma saída de fonte de dados para ser usada como uma fonte de dados de entrada para um fluxo subsequente). Os fluxos agora serão executados quando agendados, atualizando ou criando automaticamente fontes de dados nas quais as pastas de trabalho do Tableau podem se basear.
Além da capacidade de agendar fluxos, o Data Management e o Tableau Prep Conductor adicionam opções para monitorar êxitos/falhas de fluxo agendado, enviar notificações por e-mail quando programações de fluxo forem bem-sucedidas ou falharem, executar fluxos programaticamente com a API REST do Tableau Server/Cloud e se beneficiar de recursos adicionais de Exibição Administrativa para monitorar o histórico de desempenho do fluxo.
RECOMENDAÇÃO DE PRÁTICAS RECOMENDADAS: se você planeja executar um grande número de fluxos do Tableau Prep Conductor no Tableau Server, talvez seja necessário ajustar o dimensionamento do seu ambiente de servidor. Se necessário, ajuste o desempenho do sistema Tableau Server adicionando nós adicionais ou processos em segundo plano para acomodar a carga de fluxo de preparação necessária.
E o Tableau Cloud? Embora não seja necessário considerar alterações de arquitetura no Tableau Cloud para capacidade de fluxo de preparação, você deverá adquirir um Bloco de recursos (uma unidade de capacidade de computação do Tableau Cloud) para cada fluxo simultâneo do Tableau Prep Conductor que desejar agendar. Determine quantas agendas de fluxo simultâneo você precisa e adquira blocos de recursos do Tableau Cloud adequadamente.
Conexões virtuais
Em nosso próximo recurso de gerenciamento de dados – Conexões virtuais. A conexão virtual fornece um ponto de acesso central aos dados. Ele pode acessar várias tabelas em vários bancos de dados. As conexões virtuais permitem que você gerenciem a extração de dados e a segurança em um só lugar, no nível da conexão.
Quando as conexões virtuais são úteis?
Se você considerar uma forma tradicional de compartilhar uma conexão de banco de dados com várias pastas de trabalho no Tableau, provavelmente pensará em conectar-se diretamente a um servidor de banco de dados como SQL Server ou Snowflake, fornecendo credenciais de logon do banco de dados, adicionando e unindo colunas de uma ou mais tabelas e, em seguida, publicar a fonte de dados no Tableau Server ou Tableau Cloud. Embora você possa optar por usar isso como uma conexão em tempo real com os dados, é muito possível que você queira extrair dados da fonte de dados para acelerar as pastas de trabalho conectadas.
Para fins de discussão, consideraremos que você pode fazer isso inúmeras vezes para acomodar, por exemplo, um conjunto diferente de tabelas ou uniões de colunas, resultando em diversas fontes de dados publicadas (e, talvez, extraídas) usadas para uma série de pastas de trabalho que possuem requisitos de tabela/união de colunas diferentes, mas que usam o mesmo banco de dados inicial.
Agora, vamos considerar o que acontece se algo no banco de dados SQL Server ou Snowflake inicial referenciado nessa série de fontes de dados for alterado – talvez as tabelas sejam renomeadas, campos adicionais sejam adicionados ou as credenciais do banco de dados sejam alteradas. Agora você se depara com a tarefa de abrir cada uma das fontes de dados criadas anteriormente, fazer as alterações necessárias para acomodar a alteração do banco de dados e republicar (e, talvez, reagendar as atualizações de extração).
Talvez você ache muito mais simples criar apenas uma “definição” inicial de conexão de dados que armazene o nome do servidor de banco de dados, credenciais e referências de tabela. E você pode preferir extrair dados dessa “definição” maior. Então, quando precisar criar fontes de dados diferentes para diversas combinações de tabelas, junções e assim por diante, você poderá fazer referência a essa “definição” inicial em vez de conectar-se diretamente a um ou mais servidores de banco de dados. Se algo na estrutura principal do banco de dados for alterado (por exemplo, os nomes das tabelas forem alterados ou as credenciais forem modificadas), você só precisará modificar o objeto de “definição” inicial e todas as fontes de dados dependentes herdarão automaticamente as alterações.
O recurso de gerenciamento de dados introduz esse recurso de “definição” compartilhada por meio de uma conexão virtual. Uma conexão virtual é semelhante a uma conexão de fonte de dados padrão, pois armazena o servidor de banco de dados, credenciais de logon e tabelas selecionadas. E, como uma fonte de dados tradicional do Tableau, uma conexão virtual pode conter conexões com mais de um banco de dados/fonte de dados (cada uma com seu próprio conjunto de credenciais e tabelas). Embora algumas modificações de metadados sejam permitidas em uma conexão virtual (por exemplo, ocultar ou renomear campos), as tabelas não são unidas na conexão virtual. Por fim, ao usar a conexão virtual como uma fonte direta para uma pasta de trabalho ou como um tipo de conexão para uma fonte de dados publicada adicional, você poderá unir colunas de tabelas e realizar personalizações adicionais na fonte de dados.
Depois que uma conexão virtual tiver sido criada e publicada no Tableau Server ou Tableau Cloud e as permissões adequadas tiverem sido definidas, você poderá se conectar à conexão virtual no Tableau Desktop ou no Tableau Server/Cloud como faria com qualquer outra fonte de dados. No entanto, você não precisará especificar um local de servidor de banco de dados ou fornecer credenciais e poderá imediatamente unir colunas de tabelas e visualizar dados ou publicar a fonte de dados.
Políticas de dados
Além dos recursos centralizados de conexão com o banco de dados descritos anteriormente, as conexões virtuais do Tableau Data Management também oferecem uma opção de segurança em nível de linha centralizada mais simplificada com Políticas de dados. Use uma política de dados para aplicar segurança em nível de linha a uma ou mais tabelas na conexão virtual. Uma política de dados filtra os dados, garantindo que os usuários vejam apenas os dados que deveriam ver. As políticas de dados se aplicam a conexões em tempo real e de extração.
Quando as políticas de dados são úteis?
É comum em muitas organizações restringir automaticamente os dados visíveis em uma visualização apenas ao que é aplicável ao usuário atual. Por exemplo, considere um painel compartilhado que contém detalhes do pedido em um objeto de referência cruzada.
Se você for gerente de vendas em um território grande, a tabela de referência cruzada de detalhes mostrará os pedidos de cada executivo de contas em seu território.
No entanto, se você for um executivo de contas individual, a tabela de referência cruzada de detalhes mostrará apenas os pedidos para suas contas.
Este cenário exige que a Segurança em nível de linha seja implementada no ambiente do Tableau, o que pode ser feito com um dos vários métodos, incluindo:
Segurança em nível de linha no banco de dados. Sempre que uma visualização é visualizada, o visualizador é solicitado a fazer logon no banco de dados subjacente com suas próprias credenciais ou suas credenciais são herdadas da conta de usuário do Tableau. O conjunto de dados resultante é restrito apenas aos dados que eles têm permissão para ver com base nas credenciais fornecidas. Isso não apenas pode se tornar tedioso rapidamente, pois cada visualizador precisa manter suas próprias credenciais, mas a conexão de dados em tempo real pode afetar o desempenho, colocando uma grande carga no banco de dados subjacente. Além disso, algumas opções de transmissão de credenciais para conexões em tempo real podem ser restritas com o Tableau Cloud.
Filtros dos usuários do Tableau. Os filtros do usuário são aplicados ao criar planilhas individuais em uma pasta de trabalho. Ao especificar combinações de credenciais de usuários individuais do Tableau ou associação a um ou mais grupos de usuários do Tableau, planilhas individuais podem ser filtradas para mostrar apenas dados relevantes para esse usuário. Isso pode se tornar entediante, pois cada planilha individual em uma pasta de trabalho exige o fornecimento de filtros de usuário – não há como especificar um filtro de usuário em um grande grupo de pastas de trabalho com um processo. Além disso, se um usuário receber inadvertidamente permissões de edição na pasta de trabalho, ele poderá facilmente arrastar o filtro de usuário para fora da divisória de filtros e ver todos os dados subjacentes que talvez não tenha permissão para visualizar.
Ao usar um subconjunto da linguagem de cálculo do Tableau, as políticas de dados podem especificar regras sofisticadas (talvez pelo uso de uma “tabela de direitos” relacionada em um banco de dados) para personalizar e limitar os dados retornados pela conexão virtual, com base na ID do usuário ou na associação ao grupo. Isso não apenas mantém a segurança em nível de linha no nível da fonte de dados (todas as pastas de trabalho conectadas à fonte de dados herdarão automaticamente a segurança e adotarão quaisquer alterações feitas na conexão virtual), mas também adiciona uma camada adicional de segurança, restringindo qualquer modificação de dados políticas apenas para aqueles com permissões de edição para a conexão virtual original.