统计文件
本文介绍如何将 Tableau 连接到统计文件并设置数据源。
Tableau 可连接到 SAS (*.sas7bdat)、SPSS (*.sav) 和 R(*.rdata、*.rda)数据文件。
注意:自版本 2020.1 起,Tableau 不再支持使用 SASYZCR2 压缩的统计文件。使用其他压缩方案使文件可供 Tableau 读取。
启动 Tableau,并在“连接”下选择“统计文件”,选择要连接到的文件,然后选择“打开”。
在数据源页面上,执行下列操作:
(可选)在页面顶部选择默认数据源名称,然后输入要在 Tableau 中使用的唯一数据源名称。例如,使用可帮助其他数据源用户推断出要连接的数据源的数据源命名约定。
选择工作表标签以开始分析。
有关连接到多个表的信息,请参见联接数据。
统计文件数据源示例
以下是在 Windows 计算机上使用 Tableau Desktop 的统计文件数据源的示例:
注意以下各项:
统计文件连接器不支持值标签。
统计文件连接器只支持每个统计文件一个表。
如果出现错误消息“与数据源通信时出错”,请确保您的统计文件只包含一个对象,并且该对象是数据框架或矩阵。R 文件可能包含位于似乎是空白的工作区中的隐藏对象。若要检查是否存在隐藏对象,请从 RStudio 中运行
ls(environment(), all.names=TRUE)
。您可以更改统计文件的字符编码。有关详细信息,请参见更改统计文件的字符编码。
R 数据文件应该只包含下列对象类型之一:
二维矩阵
矢量
因素
数据帧
请注意,如果 R 数据文件包含多个对象,则 Tableau 将连接到第一个对象。
Tableau 支持使用二进制格式的 R 数据文件。
Tableau Desktop 中不支持 ASCII 格式的文件。如果您尝试使用具有 ASCII 格式的 .rdata 或 .rda 文件,您将看到一个错误,指出“Unable to read from file the table '' '[TableauTemp].[filename.rdata]' does not exist”(无法从文件中读取表,‘[TableauTemp].[filename.rdata]’不存在)。 在这种情况下,您可以使用 RStudio 将文件保存为二进制格式,如下所示:
- 如果您没有 RStudio,请下载 RStudio。
- 在 RStudio 中打开 R 数据文件。您应该会在右上角的全局环境窗口中看到您的数据对象。
使用“save()”函数将对象保存到一个新文件中,如下所示:
save(<objectName>,file="<filename>",ascii=FALSE)
其中:<objectName> 是您的数据对象,<filename> 是新文件的名称,“FALSE”区分大小写
提示:若要快速查看此函数的文档,请在命令提示符处键入“?save”。
Tableau Desktop 中不支持压缩的文件。与 Tableau 连接之前,您必须使用诸如 Gzip 或 WinZip 之类的另一个程序解压缩文件。
Tableau 会根据文件的字符编码或输入文件中的信息读取统计文件(例如,SAS 或 R 文件)中的数据。R 文件通常使用操作系统的字符编码,相比之下,SAS 和 SPSS 文件将字符编码信息包含在文件中。有时候,您可能需要指定另一种编码。例如,如果同事向您发送一个具有希腊语字符编码的统计文件,则您必须指定希腊语字符集,才能将该文件与 Tableau 一起使用。如果从统计文件读取时需要使用不同的字符集,则可以创建 Tableau 数据源定制 (TDC) 文件并指定要使用的编码。
创建 TDC 文件
.tdc 文件是一个 XML 文件,适用于单个数据源,并且包含数据源提供程序的供应商和驱动程序名称信息。对于统计文件连接器,供应商和驱动程序名称为 stat-direct
。
若要创建 TDC 文件,请执行以下操作:
打开纯文本编辑器(例如记事本)。
复制以下提供的示例中的信息,将其粘贴到文本文件中,然后指定
source-charset
值。(有关编码的列表,请参见统计文件连接器支持的用户定义编码。)使用 .tdc 扩展名(例如
r-statsfile.tdc
)将文件保存到 我的 Tableau 存储库\Datasources 文件夹中。
示例 TDC 文件会设置 source-charset 值
以下 TDC 文件示例将 source-charset
值设置为统计文件数据源的 shift-jis
。
<connection-customization class='stat-direct' enabled='true' version='10.0'>
<vendor name='stat-direct' />
<driver name='stat-direct' />
<customizations>
<customization name='source-charset' value='shift-jis' />
</customizations>
</connection-customization>
重要信息:TDC 文件可用于定制连接的功能或诊断和解决与连接数据相关的问题。Tableau 无法彻底测试您可能对这些文件进行的所有潜在修改。创建和使用 TDC 文件需要手动编辑,并且在将其部署到生产环境之前对其进行彻底测试至关重要。
在计算机的目录中导航时,您可能会注意到 .ttde 或 .hhyper 文件。当您创建连接到数据的 Tableau 数据源时,Tableau 会创建 .ttde 或 .hhyper 文件。此文件(也称为阴影数据提取)用于帮助提高 Tableau Desktop 中的数据源加载速度。尽管阴影数据提取包含类似于标准 Tableau 数据提取的基础数据和其他信息,但阴影数据提取将以其他格式保存,并且无法用于恢复数据。
注意:2024.2 以后的 Tableau 版本不再支持 .tde 文件。现在所有数据提取都为 .hyper 格式。