Tableau Data Management

此内容是T ableau Blueprint 的一部分,这是一个成熟度框架,允许您放大并改进组织使用数据来推动影响的方式。若要开始您的旅程,请参加我们的评估(链接在新窗口中打开)

 

Tableau Data Management 可以帮助您更好地管理分析环境中的数据,确保可信的最新数据可始终用于决策制定。从数据准备到目录编制、搜索和管控,Tableau Data Management 让人们更加信任您的数据,从而加速自助式分析技术的采用。该产品是一个单独许可的功能集合,包括 Tableau Prep Conductor 和 Tableau Catalog,用于管理 Tableau Server 和 Tableau Cloud 中的 Tableau 内容和数据资产。

什么是 Tableau Data Management?

总体而言,您的组织将受益于 Tableau Blueprint 中其他部分讨论的数据治理数据源管理方法。除了这些方法之外,您还会在数据库、数据分析和可视化社区中经常听到对术语“Data Management”的一般性引用。然而,当涉及到带有 Tableau Data Management 的 Tableau 时,这个术语变得更加具体。Tableau Data Management 是一组功能,可与 Tableau Server 和 Tableau Cloud 一起使用。无论您使用的是适用于 WindowsLinux 的 Tableau Server,还是 Tableau Cloud,Tableau Data Management 的功能大部分都是相同的(一小部分功能可能仅在 Tableau Cloud 或 Tableau Server 中可用)。

Tableau Data Management 包含一套工具,可帮助组织的数据管理员和分析师管理 Tableau 环境中与数据相关的内容和资产。具体来说,当您购买 Tableau Data Management 时,会添加三个额外的功能集:

  • Tableau Catalog

  • Tableau Prep Conductor

  • 使用数据策略的虚拟连接

Tableau Catalog

Tableau Data Management 的原始功能 Tableau Catalog 提供了一些功能来帮助简化对 Tableau 数据源的访问、理解和信任。Tableau Catalog 专注于世系、数据质量、搜索和影响分析等领域,可以使数据管家和数据可视化人员/分析师更容易理解和信任 Tableau Server 和 Cloud 中的数据源。Tableau Catalog 通过 Tableau REST API 中的元数据方法为 Tableau 开发人员提供了额外的功能。

最初启用 Tableau Catalog 时,它会扫描Tabl Tableau Server 或 Cloud站点中的所有相关内容项目,以构建所有相关对象的关联视图(Tableau Catalog 将其称为内容元数据)。这扩展了搜索功能,而不仅仅是数据连接。数据管家和可视化作者也可以基于列、数据库和表进行搜索。

为了降低无意中修改或删除另一个对象所依赖的对象的可能性(例如,重命名或移除对生产工作簿至关重要的数据库列),Tableau Catalog 的世系功能揭示了 Tableau 站点上所有内容之间的相互关系,包括指标、流程和虚拟连接。现在,您可以轻松地看到对象之间的关系,并在做出更改之前分析待定更改的影响。

 

为了提高对 Tableau 数据源的信任度,Tableau Catalog 提供了补充信息,例如扩展的数据相关对象描述数据详细信息视图和关键字标签,以提高搜索灵活性。认证数据源会在数据源旁边放置一个突出的图标,以表示数据源所有者或管理员对数据源的信任。可能引起使用者关注的数据项(数据源、列等),如已弃用或陈旧的数据,可能会被指定为带有数据质量警告。除了数据质量警告选项之外,敏感数据还可以用敏感标签进行特别标记。

 

 

Tableau Prep Conductor

如果您和许多 Tableau 客户一样,已经发现了 Tableau Prep Builder 创建复杂的数据准备“流程”的好处,这些流程可以组合多个数据源、形状数据、自定义列以及输出一种或多种所需的数据格式。但是,一旦您创建了完美的 Prep 流程,您如何按照计划自动运行和完全或增量更新数据源呢?

这就是 Data Management 的另一个功能 Tableau Prep Conductor 发挥作用的地方。Tableau Prep Conductor 允许灵活调度 Tableau Prep 流程,无论它们是从 Tableau Prep Builder 发布到 Tableau Server 或 Tableau Cloud 环境,还是通过 Prep Flow Web 制作在浏览器中直接创建。首先测试您的基于 Web 的流程(您可以在没有 Data Management 的情况下按需手动运行流程,但需要购买 Data Management 来安排流程通过 Prep Conductor 自动运行)。在您计划之前,该流程应该运行完成并创建所需的输出数据源,并且没有错误。

如果您使用 Tableau Server,您的管理员(或您,如果您有适当的权限)可以创建自定义计划(如“每天午夜”、“周日中午”等)来运行 Prep 流程,就像您对数据提取刷新所做的那样。

如果您使用的是 Tableau Cloud,默认情况下会安装一组预定义的 Prep 流程计划。您不能自定义这些计划或创建自己的 Prep 流程计划。

从“操作”菜单中安排流程运行。单个任务计划将仅按您选择的计划运行选定的 Prep 流程。如果您希望“链接”多个流程以特定的顺序运行(可能是为了创建一个数据源输出以用作后续流的输入数据源),链接任务 计划将允许您选择一个或多个附加流程与所选流程一起按顺序运行。现在,流程将按计划运行,自动更新或创建 Tableau 工作簿可能基于的数据源。

除了计划流程的能力之外,Data Management 和 Tableau Prep Conductor 还添加了监控计划流程成功/失败的选项,在流程计划成功或失败时发送电子邮件通知,通过Tableau Server/Cloud REST API 以编程方式运行流程,并受益于额外的管理视图功能来监控流程性能历史记录。

最佳做法建议:如果您计划在 Tableau Server 上运行大量 Tableau Prep Conductor 流程,您可能需要调整服务器环境的规模。如有必要,通过添加额外的节点或后台程序进程来调整 Tableau Server 系统的性能,以适应所需的 Prep 流程负载。

Tableau Cloud 怎么样?虽然您不需要考虑对 Tableau Cloud 进行架构更改以获得 Prep 流程容量,但您需要为您希望计划的每个并发 Tableau Prep Conductor 流程获取一个资源块(Tableau Cloud 计算容量的单位)。确定您需要多少个并发流程计划,并相应地购买 Tableau Cloud 资源块。

 

虚拟连接

我们的下一个Data Management 功能 - 虚拟连接。虚拟连接为数据提供了一个中央访问点。它可以访问多个数据库中的多个表。虚拟连接使您可以在连接级别集中管理提取数据和安全性。

虚拟连接什么时候有用?

如果考虑在 Tableau 中与多个工作簿共享数据库连接的传统方式,您可能会想到直接连接到 SQL Server 或 Snowflake 等数据库服务器,提供数据库登录凭据,添加和联接一个或多个表,然后将数据源发布到 Tableau Server 或 Tableau Cloud。虽然您可以选择将此用作数据的实时连接,但您很可能希望从数据源提取数据以加快连接工作簿的速度。

为了便于讨论,我们假设您可能会多次这样做,以适应不同的表或连接集,从而导致多个已发布(以及可能已提取)的数据源用于一系列具有不同表/联接要求但都使用相同初始数据库的工作簿。

现在,让我们考虑一下,如果该系列数据源中引用的初始 SQL Server 或 Snowflake 数据库的某些内容发生了变化(可能是重命名了表、添加了额外的字段或更改了数据库凭据),会发生什么情况。您现在面临的任务是打开以前创建的每个数据源,进行必要的更改以适应数据库的更改,并重新发布(也许还要重新计划数据提取刷新)。

您可能会发现只创建一个存储数据库服务器名称、凭据和表引用的初始数据连接“定义”要简单得多。而且,您可能更喜欢从更大的“定义”中提取数据。然后,当您需要为各种表、连接等的组合创建不同的数据源时,您可以引用该初始“定义”,而不是直接连接到一个或多个数据库服务器。如果核心数据库结构发生变化(例如,表名发生变化或凭据被修改),您只需修改初始的“定义”对象,所有相关数据源都会自动继承这些变化。

Data Management 功能通过虚拟连接引入了这种共享的“定义”功能。虚拟连接与标准数据源连接相似,它存储数据库服务器、登录凭据和选定的表。而且,与传统的 Tableau 数据源一样,虚拟连接可以包含到多个数据库/数据源的连接(每个数据库/数据源都有自己的一组凭据和表)。虽然虚拟连接中允许某些元数据修改(例如,隐藏或重命名字段),但虚拟连接中不联接表。当您最终将虚拟连接用作工作簿的直接来源或其他已发布数据源的连接类型时,您可以联接表并对数据源执行进一步的自定义。

一旦创建了虚拟连接并发布到 Tableau Server 或 Tableau Cloud,并且设置了适当的权限,您就可以像连接任何其他数据源一样连接到 Tableau Desktop 或 Tableau Server/Cloud 的虚拟连接。但是,您不需要指定数据库服务器位置或提供凭据,并且您将能够立即联接表并继续可视化数据或发布数据源。

 

数据策略

除了前面介绍的集中式数据库连接功能之外,Tableau Data Management 虚拟连接还通过数据策略提供了更简化的集中式行级安全性选项。使用数据策略将行级安全性应用于虚拟连接中的一个或多个表。数据策略筛选数据,确保用户只看到他们应该看到的数据。数据策略适用于实时连接和数据提取连接。

数据策略何时有用?

在许多组织中,自动将可视化中可见的数据限制为仅适用于当前用户是很常见的。例如,考虑在交叉选项卡对象中包含订单详细信息的共享仪表板。

  • 如果您是一个大区域的销售经理,详细信息交叉选项卡将显示您所在区域的每个客户经理的订单。

  • 但是,如果您是个人客户经理,详细信息交叉选项卡将仅显示您的客户的订单。

这种情况要求在 Tableau 环境中实现行级安全性,这可以通过几种方法之一来实现,包括:

  • 数据库中的行级安全性。每次查看可视化项时,都会提示查看者使用他们自己的凭据登录基础数据库,或者他们的凭据是从他们的 Tableau 用户帐户继承的。根据提供的凭据,生成的数据集仅限于允许他们查看的数据。这不仅会很快变得繁琐,因为每个查看者都需要维护自己的凭据,而且实时数据连接可能会对基础数据库造成巨大负担,从而影响性能。此外,Tableau Cloud 可能会限制将凭据传递给实时连接的某些选项。

  • Tableau 用户筛选器。在工作簿中创建单个工作表时会应用用户筛选器。通过指定单个 Tableau 用户凭据或一个或多个 Tableau 用户组成员身份的组合,可以筛选单个工作表以仅显示与该用户相关的数据。这可能会变得很繁琐,因为工作簿中的每个单独的工作表都需要提供用户筛选器 - 无法通过一个过程为一大组工作簿指定用户筛选器。此外,如果用户无意中被授予了对工作簿的编辑权限,他们可能会很容易地将用户筛选器从筛选器功能区上拖出,并查看他们可能无权查看的所有基础数据。

通过使用 Tableau 计算语言的子集,数据策略可以指定复杂的规则(可能通过使用数据库中的相关“权利表”),以根据用户 ID 或组成员身份自定义和限制虚拟连接返回的数据。这不仅维护了数据源级别的行级安全性(连接到数据源的所有工作簿都将自动继承安全性并采用虚拟连接中所做的任何更改),还通过将数据策略的任何修改限制为仅对原始虚拟连接具有编辑权限的用户来增加了一层额外的安全性。

 

 

感谢您的反馈!您的反馈已成功提交。谢谢!