关于 Tableau Catalog
数据在卷、格式和重要性方面不断增加,使环境变得更加复杂。随着数据的快速变化,将很难跟踪该数据以及它在这种复杂的环境中的使用情况。同时,更多的用户需要在更多地方访问更多的数据,而且用户很难找到正确的数据。最终,这会导致对数据缺乏信任,因为人们会对自己是否正在使用正确来源或者数据是否为最新有疑问。
Tableau Catalog 集成了世系、影响分析、数据字典、数据质量警告和 Tableau 应用程序内搜索等功能,可帮助您通过独立的目录以不同方式解决这些问题。它对 IT 和最终用户都有所侧重,因此使用 Tableau Server 或 Tableau Cloud 的每个人都更加信任并能更深入地查看数据,同时还能发现更多内容。Tableau Catalog 依据您的组织使用的 Tableau 内容中构建一个目录,从而实现了诸如以下的全面功能:
- 影响分析和世系。
- 您可以查看依赖于您管理的表或数据源中的特定列或字段的工作簿和其他 Tableau 内容。在需要更改数据时,您可以使用电子邮件通知受影响的 Tableau 作者。
- 作为工作簿作者,您可以使用世系来跟踪工作簿所依赖的字段。
- 作为用户,当您使用 Tableau 可视化项时,您可以看到用于创建的数据来自何处。
- 策展和信任。作为数据专员,您可以添加有用的元数据(如说明和证书),以便用户可找到正确的数据。您可以设置数据质量警告、在“数据详细信息”窗格中查看数据详细信息、对资产进行认证,以及从目录中移除资产。
- 数据发现。在 Tableau Desktop 或 Tableau Web 制作中,您可以使用 Tableau Catalog 来搜索数据库、表、数据源和虚拟连接,以便在 Tableau 中进行分析,并从搜索结果中连接到它们。
从 2019.3 开始,Tableau Catalog 作为适用于 Tableau Server 和 Tableau Cloud 的 Data Management 的一部分提供。当产品密钥处于活动状态并启用时,上述目录功能已集成到您使用的产品中,这样您就可以在发现数据的地方就地对其进行处理。
Tableau Catalog 的工作方式
Tableau Catalog 可发现您的站点上的所有内容(工作簿、数据源、工作表、虚拟连接和流程)并对其建立索引,以收集有关内容的元数据。根据元数据,可以识别外部资产(数据库、表和其他对象)。了解内容与外部资产之间的关系使 Tableau 能够显示内容和外部资产的世系。利用 Tableau Catalog,用户还能够使用 Tableau Server 或 Tableau Cloud 连接到外部资产。
您站点上的用户可以发布或删除内容,可以附加数据质量警告或认证,或者执行任何其他更改站点上的内容或其元数据的操作,Tableau Catalog 将相应地更新其信息。
有关如何使用 Tableau Catalog 为在组织中进行数据管控提供支持的信息,请参见 Tableau Blueprint 帮助中的 Tableau 的管控(链接在新窗口中打开)。
Tableau Catalog 关键术语
- 元数据。有关数据的信息。
- Tableau 内容。在 Tableau 中创建的内容,例如工作簿、数据源、虚拟连接和流程。
- 外部资产。发布到 Tableau Server 或 Tableau Cloud 的 Tableau 内容使用的数据库和表的相关元数据。
Tableau Catalog 许可
Tableau Catalog 通过 Data Management 获得许可。有关 Data Management 许可的工作方式的信息,请参见许可 Data Management。
启用 Tableau Catalog
Tableau Server 或 Tableau Cloud 获得 Data Management 功能许可后,您可通过执行以下任务之一来启用 Tableau Catalog:
- 对于 Tableau Cloud,无需进行操作。Tableau Catalog 默认情况下已启用,配置为使用派生权限,可以马上使用。有关派生权限的详细信息,请参见元数据权限主题。
对于 Tableau Server,服务器管理员必须首先使用
tsm maintenance metadata-services
命令启用 Tableau 元数据 API。有关详细信息,请参见启用 Tableau Catalog。启用元数据 API 后,Tableau Catalog 默认情况下已启用,配置为使用派生权限,可以马上使用。有关派生权限的详细信息,请参见元数据权限主题。
特性和功能
若要详细了解可用于 Tableau Catalog 的功能,请参见以下帮助文章:
数据发现
- 在 Tableau Desktop 的“连接”窗格中的“搜索数据”下,选择“Tableau Server”以使用 Tableau Server 或 Tableau Cloud 连接到数据(链接在新窗口中打开)。启用 Tableau Catalog 之后,除了搜索要连接的已发布的数据源之外,您现在可以搜索并连接到 Tableau Server 或 Tableau Cloud 站点上已发布数据源和工作簿使用的特定数据库、表和对象。
- 启用 Tableau Catalog 之后,搜索(链接在新窗口中打开)范围得到扩展,可包括基于列、数据库、表和其他对象的结果。
- 如果您在 Web 上进行制作,则除了已发布数据源外,您还可以连接到数据库和表(链接在新窗口中打开)。
- 如果您在 Web 上使用 Tableau Prep,则可以基于外部资产(例如数据库和表)创建新流程(链接在新窗口中打开)。
- 如果您连接到 Salesforce Data Cloud(链接在新窗口中打开) ,您将看到对 Tableau Catalog 中内置的原生 Data Cloud 对象的支持。数据湖对象 (DLO)、数据模型对象 (DMO) 和计算见解在搜索、连接和世系页面中显得截然不同,这使得发现、连接和重用它们变得更加简单。
策展和信任
- 对数据资产进行认证(链接在新窗口中打开),帮助用户查找受信任的数据和推荐的数据。
- 设置数据质量警告(链接在新窗口中打开),将数据质量问题(例如过时或已弃用的数据)告知用户。
- 添加敏感度标签(链接在新窗口中打开)可警告用户需要小心处理的数据。
- 添加自定义标签(链接在新窗口中打开)以适合您组织需求的方式对数据进行分类
- 管理数据标签(链接在新窗口中打开)以扩展用户可用的标签名称和类别。
- 使用标记(链接在新窗口中打开)对 Tableau Server 和 Tableau Cloud 上的项目进行分类,以帮助用户筛选外部资产。
- 通过使用“数据详细信息”(链接在新窗口中打开)选项卡来查看所使用数据的信息,从而更好地了解发布的可视化项。
- 向数据库、表和列添加说明(链接在新窗口中打开),帮助用户查找所需数据。
世系和影响分析
- 使用世系(链接在新窗口中打开)来跟踪数据的来源,以及分析数据更改的影响并确定哪些用户可能受到影响。
- 通过电子邮件(链接在新窗口中打开)将有关数据相关更新的信息告知工作簿、数据源或流程的所有者。对数据库、表或对象联系人执行相同的操作。
开发人员资源
您可以使用 Tableau REST API 中的元数据方法以编程方式更新某些元数据。有关元数据方法的详细信息,请参见 Tableau Server REST API 中的元数据方法。
除了 REST API 外,您 可以使用 Tableau 元数据 API(链接在新窗口中打开) 以编程方式查询发布到 Tableau Server 或 Tableau Cloud 的内容中的元数据。元数据 API 快速且灵活,当您想要了解有关元数据及其结构之间的关系的特定信息时,它是最佳选择。使用名为 GraphiQL(链接在新窗口中打开) 的交互式浏览器中工具探索和测试针对元数据 API 架构的查询。
注意:使用元数据 API 或 GraphiQL 不需要 Data Management。