文本文件
本文介绍如何将 Tableau 连接到文本文件数据并设置数据源。Tableau 可连接到带分隔符的文本文件(*.txt、*.csv、*.tab、*.tsv)。
打开 Tableau 后,在“连接”下面,单击“文本文件”。
选择要连接到的文件,然后单击“打开”。
注意:从 Tableau 2020.2 开始,不再支持旧版 Excel 和文本连接。请参见 Tableau 社区中的 Legacy Connection Alternatives(旧版连接替代方案)文档,了解使用旧版连接的替代方案。
在数据源页面上,执行下列操作:
(可选)在页面顶部选择默认数据源名称,然后输入要在 Tableau 中使用的唯一数据源名称。例如,使用可帮助其他数据源用户推断出要连接的数据源的数据源命名约定。 默认名称是基于文件名自动生成的。
单击工作表标签以开始分析。
使用自定义 SQL 连接到特定查询,而非整个数据源。有关详细信息,请参见连接到自定义 SQL 查询。
注意:对于文本文件,自定义 SQL 仅在使用旧连接时或在 Tableau Desktop 8.2 之前创建的工作簿中可用。
文本文件数据源示例
以下是文本文件数据源的示例:
在构建视图之前,可设置以下选项。
获取更多数据
通过添加更多表或连接到不同数据库中的数据,将更多数据提供到数据源中。
从当前文件添加更多数据:从左窗格中,将其他表拖到画布上,以使用联接或并集合并数据。有关详细信息,请参见联接数据或合并数据。
从不同数据库添加更多数据:在左窗格中,单击“连接”旁边的“添加”。有关详细信息,请参见联接数据。
如果左窗格中未列出您需要的连接器,请选择“数据”>“新数据源”以添加新数据源。有关详细信息,请参见混合您的数据。
使用 Data Interpreter 清理您的数据
如果 Tableau 检测到它可以帮助优化数据源以进行分析,则会提示您使用数据解释器。数据解释器能够检测您可以使用的子表,并且能够删除以后可能会在分析中引起问题的唯一格式。有关详细信息,请参见使用 Data Interpreter 清理 Excel、CSV、PDF 和 Google Sheets 中的数据。
设置文本文件选项
在画布上,单击表下拉箭头,然后选择第一行中是否包含列名称。默认情况下已选中此选项。或者,您可以在连接时让 Tableau 生成名称。以后可以更改这些名称。您还可以选择“文本文件属性”以指定以下各项:
选择用于分隔各列的字符。从字符列表中选择或选择“其他”来键入自定义字符。
选择在文本文件中将值引起来的文本限定符。
选择用于描述文本文件编码的字符集。可用编码基于您所用的操作系统。例如,在 Windows 上,ANSI 列为 windows-1252,OEM 列为 437。
注意: 在 Tableau Desktop 8.2 之前创建的或使用旧版连接的工作簿中,可以选择“ANSI”、“OEM”、“UTF-8”、“UTF-16”或“其他”。如果选择“其他”,则必须在提供的文本字段中指定字符集。尝试连接时,将对此值进行验证。
选择分析文件时应遵循的区域设置。此选项告诉 Tableau 使用哪个小数和千位分隔符。
查看数据、数据透视表、拆分并创建计算
数据源中的前 1,000 行数据自动显示在数据网格中的画布下面。如果添加表、移除表或对联接条件进行更改,则数据网格会随着你的更改而更新。还可在数据网格中执行下列操作:
通过单击数据类型图标来更改列的数据类型或地理角色。
通过单击列下拉箭头并选择隐藏来隐藏字段。
双击字段名来重命名字段。
通过单击列下拉箭头并选择重置名称来重置字段名称。
通过从“排序字段”下拉列表中选择排序选项,对数据网格和元数据网格的字段进行排序。
通过单击列名称旁边的排序按钮在数据网格中对行进行排序。
对字段进行透视以将交叉表格式的数据转换为分列格式。此操作只可用于非旧版连接类型。有关详细信息,请参见对数据进行转置(从列到行)。
将字符串字段拆分为多个字段。此操作只可用于非旧版连接类型。有关详细信息,请参见将一个字段拆分为多个字段。
基于 Tableau 数据源中的现有字段创建新计算。单击列下拉箭头并选择“创建计算字段”。
通过选择值并按 Ctrl+C(在 Mac 上按 Command-C)来复制网格中的值。或者,若要复制元数据网格中的值,请选择值,右键单击(在 Mac 上按住 Control 单击),然后选择“复制”。
检查数据源结构并执行管理任务
使用元数据区域可快速检查 Tableau 数据源的一般结构及其字段。如果正在使用特别大的数据源,请使用元数据区域执行日常数据管理任务,如同时隐藏多个字段或快速重命名或重置字段。
实时连接或使用数据提取
在“数据源”页面顶部,选择“实时”或“数据提取”模式。如果选择创建数据提取,则会显示“编辑”链接。单击“编辑”设置对要包括在数据提取中的数据子集进行定义的筛选器。有关详细信息,请参见提取数据。
添加数据源筛选器
在数据源页面的顶部,单击“添加”来添加数据源筛选器,以控制数据源中包括的数据,从而限制数据源中字段的可见性和用法。
将文件集合在单一目录中
将多表连接的所有相关文本文件都集合在单一目录中(该目录中没有任何其他内容),使用户不可能无意选择不适用于连接的文件。
文本文件列宽度和大小注意事项
如果文本文件中包含宽度超过 254 个字符的列,则 Tableau 将无法对在 Tableau Desktop 8.2 之前创建的或使用旧版连接的工作簿使用这些字段。在 Tableau 中建立连接之前,请先移除这些列,修改这些列以使其宽度在 254 个字符以内,或升级文本文件数据源。
较大的文本文件用作数据源时性能通常较差,因为查询可能会花费很长时间。
在计算机的目录中导航时,您可能会注意到 .ttde 或 .hhyper 文件。当您创建连接到数据的 Tableau 数据源时,Tableau 会创建 .ttde 或 .hhyper 文件。此文件(也称为阴影数据提取)用于帮助提高 Tableau Desktop 中的数据源加载速度。尽管阴影数据提取包含类似于标准 Tableau 数据提取的基础数据和其他信息,但阴影数据提取将以其他格式保存,并且无法用于恢复数据。
注意:2024.2 以后的 Tableau 版本不再支持 .tde 文件。现在所有数据提取都为 .hyper 格式。