在 Tableau Cloud 上计划刷新
您可以直接在 Tableau Cloud 上针对云托管数据的数据提取计划刷新任务。这可能包括以下数据类型的数据提取:
- Salesforce.com 或 Google Analytics。
- Google BigQuery 或 Amazon Redshift(如果不想使用实时连接)。对于本地 Redshift,必须使用 Tableau Bridge。
基于 SQL 的数据或云平台(例如 Amazon RDS、Microsoft Azure 或 Google Cloud Platform)上承载的其他数据(如果不想使用实时连接,或该数据源不支持实时连接)。
有关支持的数据源的列表,请参见允许实时连接到云平台上托管的数据。
使用 Tableau Bridge 创建数据提取刷新时,还可以使用计划。有关详细信息,请参见设置 Bridge 刷新计划。
注意:
- 有关刷新 Microsoft Excel、SQL Server 或 Tableau Cloud 无法直接访问的其他数据的数据提取的信息,请参见与 Bridge 的连接。
您的 Tableau Cloud 站点具有支持所有用户分析需求的容量。站点的容量包括用于存储的容量,以及用于需要在包括数据提取的站点上执行的任务的容量。有关详细信息,请参见Tableau Cloud 站点容量。
创建刷新计划
非常重要!
- “立即运行”选项在“创建数据提取刷新”对话框中不再可用。“立即运行”选项现在列在“操作”下拉菜单中。
- 不能将任务配置为按顺序(连接)运行。相反,您可能希望错开数据提取刷新的开始时间,以便任务依次运行。
- 如果将现有任务迁移到自定义计划,请注意,除非更改这些任务的开始时间,否则这些任务将并行运行,这可能是不需要的。
- 如果您为同一工作簿或已发布数据源计划多个数据提取刷新,则这些作业会连续运行,一个作业等待前一个作业完成后再运行。
登录到 Tableau Cloud,从左侧的导航窗格中选择“浏览”,然后,根据想要刷新的内容的类型,从下拉菜单中选择“所有工作簿”或“所有数据源”。
选中要刷新的工作簿或数据源的复选框,然后选择“操作”>“刷新数据提取”。
在“刷新数据提取”对话框中,选择“计划刷新”,然后完成以下步骤:
- 刷新类型:选择所需要的刷新类型。默认情况下执行完全刷新。只有在发布数据提取之前在 Tableau Desktop 中为其配置了增量刷新,增量刷新才可用。如果选择已设置为执行完全刷新的多个工作簿或数据源之一,则禁用选择增量刷新的选项。有关详细信息,请参见 Tableau 帮助中的“刷新数据提取”。
刷新频率:设置数据提取刷新的运行频率。您可以将频率设置为每小时、每天、每周或每月运行。时间和日间隔取决于您选择的重复频率,如下所述:
每小时:可用频率是每小时从特定时间到特定时间。这意味着任务将在指定时间每小时运行一次。
每日:可用频率为每两小时、四小时、六小时、八小时或十二小时一次,或每天一次。除了开始和结束时间之外,您还可以选择一周中的一个或多天。这意味着您可以在一周的所有或特定日期以特定小时间隔运行任务,或每天运行一次。
每周:可用频率是一周中一天的特定时间。这意味着您可以在一周中的某一天运行该任务,每周在某个时间运行一次。
每月:您可以通过两种不同的方式设置此项:
您可以选择“日”作为频率间隔,然后允许您选择该月的特定日期。例如,您可以选择在每月 2 号、15 号和 28 号的下午 2:45 运行。
您还可以选择在每周的第一天、第二天、第三天、第四天、第五天和最后一天的特定时间运行。例如,您可以选择在每月的第二个星期三下午 2:45 运行该任务。
更新现有计划
更改现有计划时,您将不再从现有计划列表进行选择,而是直接更改计划中的重复周期。
数据提取刷新的时间限制
为了确保长时间运行的刷新任务不会占用所有系统资源,并且不会阻止站点上其他数据提取的刷新,Tableau Cloud 将为刷新任务强制实施 7200 秒(120 分钟或两小时)的超时限制。超时限制是单一数据提取在被取消之前完成一次刷新允许的最长时间。超时限制不可配置。
不要超过超时限制
尽管达到超时限制的情况并不常见,但如果您在大量使用数据提取的环境中工作,您只能对数据提取进行少数修改来帮助避免达到超时限制。
设置增量刷新
考虑将数据提取配置为在每次执行刷新任务时进行增量刷新,而不是完全刷新。
默认情况下,数据提取设置为完全刷新。尽管完全刷新可为您提供数据的精确副本,但完全刷新可能需要很长时间才能完成。为了缩短刷新数据提取所需的时间,请考虑改为设置数据提取的增量刷新。有关详细信息,请参见 Tableau 帮助中的配置增量数据提取刷新。
注意:您必须在将数据提取发布到 Tableau Cloud 之前设置增量刷新。发布后,您将能够在“创建数据提取刷新”对话框中选择增量刷新选项。
减少数据提取的大小
您可以通过减少数据提取的大小来帮助刷新任务更快完成。
可以通过两种常见方法来减少数据提取的大小:隐藏所有未使用的字段,以及使用数据源筛选器。
隐藏所有未使用的字段:创建数据提取时会排除您在数据源中隐藏的字段。若要在创建数据提取时隐藏字段,请参见 Tableau 帮助中的创建数据提取。
添加数据源筛选器:您可以通过添加数据源筛选器来减少数据提取中的行数。有关详细信息,请参见 Tableau 帮助中的筛选数据源中的数据。
注意:您必须在将数据提取发布到 Tableau Cloud 之前隐藏所有未使用的字段或添加数据源筛选器。
使用替代方法来刷新数据提取
如果可能,请考虑在 Tableau Cloud 外部刷新数据提取。
Tableau Desktop:您可以从 Tableau Desktop 中手动刷新发布的数据提取。有关详细信息,请参见从 Tableau Desktop 中刷新已发布数据提取。
Tableau Bridge:根据数据源而定,您可以使用 Tableau Bridge 来设置和按计划刷新发布的数据提取。有关详细信息,请参见使用 Bridge 使数据保持最新。
Tableau 数据提取命令行实用工具(已弃用):根据数据源而定,您可以使用 Tableau Desktop 附带的命令行实用工具以编程方式刷新发布的数据提取。有关详细信息,请参见从命令行中自动执行数据提取刷新任务。
2022 年 10 月已弃用:此实用工具在以后的版本中不可用。若要刷新 Tableau Cloud 无法直接访问的数据源或虚拟连接数据,请改用 Tableau Bridge。若要使用脚本启动刷新作业,请使用 tabcmd refreshextracts(链接在新窗口中打开) 或 REST API 运行数据提取刷新任务(链接在新窗口中打开)。
计划在其他时间刷新
考虑更改进行刷新任务的时间。有关详细信息,请参见管理刷新任务。
刷新任务达到超时限制时的错误
如果刷新任务达到超时限制,您或者其他人可能会看到下列错误之一。如果您是数据提取的发布者或所有者,您可能会在电子邮件通知中看到以下错误之一。如果您是站点管理员,您可能会在有关数据提取后台任务的管理视图中看到这些错误之一。
- The query time resource limit (7200 seconds) was exceeded.(已超出查询时间资源限制(7200 秒)。)
- com.tableau.nativeapi.dll.TableauCancelException: Operation cancelled.(com.tableau.nativeapi.dll.TableauCancelException: 操作已取消。)
- The query time resource limit (8100 seconds) was exceeded.(已超出查询时间资源限制(8100 秒)。)
为了帮助解决和在将来避免这些错误,请参见上面的 不要超过超时限制部分。