刷新数据提取
当原始数据发生改变时,您可以使用桌面刷新数据提取,方法是在“数据”菜单中选择数据源,然后选择 。数据提取可以通过两种方式设置:完全刷新或增量刷新。
通过完全刷新,数据提取中的所有数据都将替换为原始数据源中的最新信息。增量刷新仅添加自上次刷新以来的新行。如果您想了解有关如何提取数据的更多详细信息,可以访问提取数据页面。
注意:您还可以使用 Tableau 数据提取命令行实用工具自动执行数据提取刷新。有关详细信息,请参见Tableau 数据提取命令行实用工具。
刷新数据提取之前
如果要刷新数据提取,请在执行数据提取刷新之前记下数据提取的文件格式。如果使用版本 2022.4 对 .tde
数据提取执行刷新,则该数据提取会自动升级为 .hyper
数据提取。虽然升级到 .hyper
数据提取有许多好处,但是您将无法使用以前版本的 Tableau Desktop 打开数据提取。有关详细信息,请参见数据提取升级为 .hyper 格式。
注意:Tableau 2024.2 版本之后不再支持任何形式的 .tde 文件,必须升级为 .hyper 格式才能使用。
配置完整的数据提取刷新
默认情况下,数据提取被配置为完全刷新。这意味着每次刷新数据提取时,所有行都会替换为原始数据源中的数据。虽然这种刷新可确保您具有原始数据中的数据的精确副本,但在数据库上执行完全刷新有时需要很长时间并且开销很大,具体取决于数据提取的大小。如果未将数据提取配置为增量刷新,则选择刷新数据提取将会执行完全刷新数据提取。
发布到 Tableau Server
如果您打算将数据提取作为数据源发布到 Tableau Server,则可以在发布期间指定数据提取刷新计划。
同样,如果您要将工作簿中的数据提取发布到 Tableau Server,则也可以在发布期间指定数据提取刷新计划。有关详细信息,请参见发布工作簿时计划数据提取刷新。
发布到 Tableau Cloud
如果打算将数据提取以数据源形式发布到 Tableau Cloud,则用于刷新数据的选项取决于您的数据源的特征。有关刷新特定数据源中的数据的详细信息,请参见按数据源列出的数据提取刷新选项。
配置增量数据提取刷新
大多数数据源都支持增量刷新。您可以将刷新配置为仅添加自上次提取数据以来新增的行,而不是刷新整个数据提取。
例如,您可能有一个每天都使用新销售交易进行更新的数据源。您只需添加当天发生的新交易,而不是每天重新生成整个数据提取。随后,为了确保拥有最新数据,您可能需要每周执行一次完全刷新。
非唯一列
从版本 2024.1 开始,Tableau 引入了一项功能,使用户能够使用非唯一键列对数据提取执行增量刷新。此更新在此过程中引入了一个额外步骤。
日期范围(子范围)刷新
从版本 2024.2 开始,Tableau 引入了一项新功能,使用户能够指定特定的时间范围来刷新源中的数据。用户可以在配置数据提取时选择增量刷新,并设置刷新的最小日期范围。例如,他们可以选择刷新从刷新日期开始的过去 14 天的数据。此功能对于允许在定义的时间段内插入和追溯修改的数据源很有用,确保在增量数据提取刷新期间捕获任何更改和新数据。
在没有设置“要刷新的最小日期范围”的合格增量刷新(即子范围刷新)中,Tableau 将首先从数据提取中消除与之前记录的最高值匹配的行。随后,Tableau 查询值高于或等于前一个最高值的所有行。此方法可确保所有已删除的行以及所有新添加的行都得到考虑。
高级设置功能提供了两个用于管理数据更新的选项。您可以选择通过刷新等于或大于最后记录值的值来替换最后添加的行。或者,您可以选择通过仅刷新值大于最后记录值的数据提取来保留最后添加的行。
注意:如果源数据的数据结构发生更改(例如,添加了新列),则需要执行完全数据提取刷新,然后才能再次开始执行增量刷新。
您可以按以下步骤将数据提取设置为增量刷新。
在“数据”菜单中选择数据源,然后选择“提取数据”。
在“提取数据”对话框中,选择“所有行”作为要提取的行数。只有在提取数据库中的所有行时,才能定义增量刷新。
注意:不能将样本数据提取递增。
选择“增量刷新”。
在数据库中指定将用于标识新行的列。
例如,您可以选择日期字段或 ID 列,该列将随添加到数据库中的行单调递增。
(可选)如果在 Tableau 中选择“日期”或“日期时间”列,则可以通过指定特定日期范围对数据提取数据执行部分刷新。确定天数并指定日期/时间尺度,以建立刷新的最小日期范围(例如,从刷新日期起 14 天)。
(可选)如果未建立最小刷新范围,请展开“高级设置”来确定如何检索新行。您可以选择通过刷新等于或大于最后记录值的值来替换最后添加的行。或者,您可以选择通过仅刷新值大于最后记录值的数据提取来保留最后添加的行。
若要完成,请选择“保存设置”。
注意:如果启用聚合,则增量刷新不可用。
注意:添加筛选器后,增量刷新的高级设置将显示为灰色,并且将强制执行默认设置“不替换最后添加的行”。这样做的目的是避免某些筛选条件和“替换最后添加的行”的高级增量刷新逻辑之间可能出现的任何冲突。
上述步骤可用于定义新数据提取,或者用于针对增量刷新编辑现有数据提取。
进行增量刷新时的注意事项
编辑数据提取
如果要编辑现有数据提取,则将显示上次刷新,这样您可以确保使用正确的数据更新数据提取。
完全刷新
每次刷新数据提取时,完全刷新都会用原始数据源中的数据替换所有行。完全刷新可能需要更长的时间,并且对数据库来说代价高昂。
数据引擎
数据引擎是 Tableau 创建数据提取所使用的基础机制,存储时间值时最多精确到 3 位小数。如果为“使用列标识新行”指定日期时间或时间戳列,并且数据库使用比 Tableau 更高的精度,则在增量刷新后最终会出现重复行。举例来说,如果数据库有两个行,其中一个行的日期时间值为 2015-03-13 17:30:56.502352
,另一个行的日期时间值为 2015-03-13 17:30:56.502852
,则 Tableau 在存储这两个行时都将使用日期时间值 2015-03-13 17:30:56.502
,从而会创建重复行。
查看数据提取历史记录 (Tableau Desktop)
您可以查看刷新数据提取的历史记录,方法是在“数据”菜单中选择数据源,然后选择 。
“数据提取历史记录”对话框将显示每次刷新的日期和时间、该刷新是完全刷新还是增量刷新以及所添加的行数。如果刷新是从文件执行的,则还将显示源文件的文件名。