合并数据

您可以合并您的数据,通过将值(行)从一个表附加到另一个表来合并两个或更多表。若要合并 Tableau 数据源中的数据,表必须来自同一连接。

支持的连接器

如果您的数据源支持合并,在连接到数据之后,“新建并集”选项将显示在数据源页面的左侧窗格中。支持的连接器可能因 Tableau DesktopTableau Server 以及 Tableau Online 而异。

为了获得最佳结果,您使用并集合并的表必须具有相同的结构。即,每个表必须具有相同的字段数,并且相关字段必须具有匹配的字段名称和数据类型。

例如,假设您在按月分开的三个表中存储了以下客户采购信息。表名称为“May2016”、"June2016”、和July2016”。

May2016

客户 采购 类型
4 Lane 5 贷记
10 Chris 6 贷记
28 Juan 1 贷记

June2016

客户 采购 类型
1 Lisa 3 贷记
28 Isaac 4 现金
28 Sam 2 贷记

July2016

客户 采购 类型
2 Mario 2 贷记
15 Wei 1 现金
21 Jim 7 现金

这些表的并集会创建以下单个表,其中包含所有表中的所有行。

并集

客户 采购 类型
4 Lane 5 贷记
10 Chris 6 贷记
28 Juan 1 贷记
1 Lisa 3 贷记
28 Isaac 4 现金
28 Sam 2 贷记
2 Mario 2 贷记
15 Wei 1 现金
21 Jim 7 现金

手动合并表

使用此方法来手动合并不同的表。此方法允许您将单独的表从“数据源”页面的左侧窗格拖放到“并集”对话框中。

手动合并表

  1. 在数据源页面上,双击“新建并集”以设置并集。

  2. 从左侧窗格中将表拖到“并集”对话框中。

  3. 从左侧窗格中选择另一个表并将其拖到第一个表的正下方。

    提示:若要同时向并集中添加多个表,请按 ShiftCtrl(在 Mac 上按 ShiftCommand),在左侧窗格中选择想要合并的表,然后将其拖到第一个表的正下方。

  4. 单击“应用”“确定”以合并。

使用通配符搜索来合并表 (Tableau Desktop)

使用此方法设置搜索条件以在并集中自动包括表。使用星号 (*) 通配符来匹配 Excel 工作簿和工作表名称、Google 表格工作簿和工作表名称、文本文件名、JSON 文件名、.pdf 文件名以及数据库表名称中的一系列字符或字符模式。

处理 Excel、文本文件数据、JSON 文件、.pdf 文件数据时,您也可以使用此方法来合并文件夹中的文件以及工作簿中的工作表。搜索范围限定于所选的连接。连接和连接中可用的表显示在“数据源”页面的左侧窗格上。

使用通配符搜索来合并表

  1. 在数据源页面上,双击“新建并集”以设置并集。

  2. 在“并集”对话框中单击“通配符(自动)”

  3. 输入搜索条件,您想让 Tableau 使用此条件查找要包括在并集中的表。

    例如,您可以在“包括”文本框中输入 *2016,以在 Excel 工作表中合并其名称以“2016”结尾的表。像这样的搜索条件将导致合并选定连接中的 May2016、June2016 和 July2016 表(Excel 工作表)。在本例中,此连接叫做 Sales,所建立的到 Excel 工作簿(包含所需工作表)的连接在 sales 目录内的 quarter_3 文件夹中(例如,Z:\sales\quarter_3)。

  4. 单击“应用”“确定”以合并。

扩展搜索以查找更多 Excel、文本、JSON、.pdf 数据

最初可用于合并的表的范围局限于您已经选择的连接。如果想要合并位于当前文件夹(适用于 Excel、文本、JSON、.pdf 文件)之外或其他工作簿(适用于 Excel 工作表)中的更多表,请选中“并集”对话框中的一个或两个复选框以扩展搜索。

例如,假设您想要合并当前文件夹之外 所有 名称以“2016”结尾的 Excel 工作表。则会建立到 Excel 工作簿的初始连接,该工作簿位于以上示例中的相同目录中,即 Z:\sales\quarter_3 中。

  • 包括: 如果在“包括”文本框中输入 *2016,并使对话框中的其余搜索条件保持原样,则 Tableau 会在当前文件夹中查找其名称以“2016”结尾的所有 Excel 工作表。

    在下图中,黄色突出显示的项表示当前位置,即一个 Excel 工作簿,您在“quarter_3”中创建了到该工作簿的连接。绿色框表示属于工作簿和工作表且因执行此搜索条件而合并的表。

     

  • 包括 + 将搜索扩展到子文件夹: 如果在“包括”文本框中输入 *2016,并选中“将搜索扩展到子文件夹”复选框,则 Tableau 会执行以下操作:

    • 在当前文件夹中查找名称以“2016”结尾的所有 Excel 工作表。

    • 查找名称以“2016”结尾且位于“quarter_3”文件夹的子文件夹内 Excel 工作簿中的附加 Excel 工作表。

    在下图中,黄色突出显示的项表示当前位置,即一个 Excel 工作簿,您在“quarter_3”文件夹中创建了到该工作簿的连接。绿色框表示属于工作簿和工作表且因执行此搜索条件而合并的表。

     

  • 包括 + 将搜索扩展到父文件夹:如果在“包括”文本框中输入 *2016,并选中“将搜索扩展到父文件夹”复选框,则 Tableau 会执行以下操作:

    • 例如,在当前文件夹“quarter_3”中查找名称以“2016”结尾的所有 Excel 工作表。

    • 查找名称以“2016”结尾且位于“quarter_3”文件夹的并行文件夹中的附加 Excel 工作表。在本示例中,“quarter_4”为并行文件夹。

    在下图中,黄色突出显示的项表示当前位置,即一个 Excel 工作簿,您在“quarter_3”文件夹中创建了到该工作簿的连接。绿色框表示属于工作簿和工作表且因执行此搜索条件而合并的表。

 

  • 包括 + 将搜索扩展到子文件夹 + 将搜索扩展到父文件夹:如果在“包括”文本框中输入 *2016,并选中“将搜索扩展到子文件夹”“将搜索扩展到父文件夹”复选框,则 Tableau 会执行以下操作:
    • 在当前文件夹“quarter_3”中查找名称以“2016”结尾的所有 Excel 工作表。

    • 查找位于当前文件夹“quarter_3”的子文件夹中的附加 Excel 工作簿。

    • 查找位于“quarter_3”文件夹的并行文件夹及其子文件夹中的附加 Excel 工作簿。在本示例中,“quarter_4”为并行文件夹。

    在下图中,黄色突出显示的项表示当前位置,即一个 Excel 工作簿,您已创建了到该工作簿的连接。绿色框表示属于工作簿和工作表且因执行此搜索条件而合并的表。

注意: 处理 Excel 数据时,通配符搜索包括命名范围,但会排除 Data Interpreter 找到的表。

重命名、修改或移除并集

在“数据源”页面的画布中直接执行基本合并任务。

重命名并集
  1. 双击包含合并的物理表的逻辑表。

  2. 在物理层画布上双击并集表。

  3. 输入并集的新名称。

在并集中添加或移除表
  1. 双击包含合并的物理表的逻辑表。

  2. 单击并集下拉箭头,然后选择“编辑并集”

  3. 您可以从左侧窗格中拖动想要合并的其他表,或者将鼠标悬停在表上,直到显示移除图标为止,然后单击相应的图标以删除此表。

  4. 单击“应用”“确定”以完成任务。

移除并集
  • 双击包含合并的物理表的逻辑表,然后单击并集下拉箭头并选择“移除”

匹配字段名称或字段排序

并集中的表通过匹配字段名称来合并。处理 Excel、Google 表格、文本文件、JSON 文件或 .pdf 文件数据时,如果没有匹配的字段名称(或者您的表不包含列标题),则可以指示 Tableau 根据基础数据中字段的顺序来合并表,方法是创建并集,然后从并集下拉菜单中选择“自动生成字段名称”选项。

关于并集的元数据

创建并集后,会生成关于并集的附加字段,并将其添加到网格中。新字段提供关于并集中原始值的来源的信息,包括工作表和表名称。在工作表或表名称中嵌入对分析至关重要的独特信息时,这些字段很有用。

例如,上面示例中所使用的表在表名称而不是数据本身中存储了独有的月份和年份信息。在此情况下,您可以使用并集生成的“表名称”字段访问此信息,并在分析中使用它。

如果并集中使用了命名范围,则“工作表”字段下会显示空值。

注意: 您可以使用并集生成的字段(例如“工作表”“表名称”)作为联接键。您可以将联接中的合并表与另一个表或合并表配合使用。

在并集中合并不匹配的字段

当并集中的字段名称不匹配时,并集中的字段包含 Null 值。您可以使用合并选项将非匹配字段合并成单个字段以移除 Null 值。使用合并选项时,原始字段会被替换为新字段,新字段将显示非匹配字段中每一行的第一个非 Null 值。

您也可以创建自己的计算,或者修改基础数据以合并非匹配字段(如有可能)。

例如,假定将第四个表“August2016”添加至基础数据。该表将不包含标准“Customers”字段名称,而是包含名为“Cust.”的缩写版本。

August2016
Cust. 采购 类型
7 Maria 2 贷记
9 Kathy 1 贷记
18 Vijay 7 现金

这些表的并集会创建一个表,其中包含表中具有一些空值的所有行。可以使用合并选项将相关的客户字段合并为单个字段。

并集(具有空值)

客户 采购 类型 Cust.
4 Lane 5 贷记
10 Chris 6 贷记
28 Juan 1 贷记
1 Lisa 3 贷记
28 Isaac 4 现金
28 Sam 2 贷记
2 Mario 2 贷记
15 Wei 1 现金
21 Jim 7 现金
7 2 贷记 Maria
9 1 贷记 Kathy
18 7 现金 Vijay

 

 

 

 

 

 

 

(包含已合并的列的)并集

采购 类型 Customer, Cust.
4 5 贷记 Lane
10 6 贷记 Chris
28 1 贷记 Juan
1 3 贷记 Lisa
28 4 现金 Isaac
28 2 贷记 Sam
2 2 贷记 Mario
15 1 现金 Wei
21 7 现金 Jim
7 2 贷记 Maria
9 1 贷记 Kathy
18 7 现金 Vijay

合并字段后,您可以在转置中使用通过合并生成的字段,或者拆分字段或将字段用作联接键。您还可以更改通过合并生成的字段的数据类型。

合并不匹配的字段

  1. 选择网格中的两个或更多个列。

  2. 单击列下拉箭头,然后选择“合并不匹配的字段”

移除合并
  • 单击合并字段的列下拉箭头,然后选择“移除合并”

总览:使用并集

Tableau Desktop 和 Web 制作(Tableau Online 和 Tableau Server)

  • 合并表可在联接中使用。

  • 合并表可在与另一个合并表的联接中使用。

  • 并集生成的字段(“工作表”“表名称”)可用作联接键。

  • 如果并集中使用了命名范围,则“工作表”字段下会显示空值。

  • 通过合并生成的字段可在转置中使用。

  • 通过合并生成的字段可用作联接键。

  • 可以更改通过合并生成的字段的数据类型。

  • 合并相同连接内的表。即,您不能合并不同数据库中的表。

仅限 Tableau Desktop

  • 处理 Excel 数据时,通配符搜索包括命名范围,但会排除 Data Interpreter 找到的表。

  • 通过合并生成的字段可在转置或拆分中使用。

  • 若要合并 JSON 文件,它必须具有 .json、.txt 或 .log 扩展名。有关处理 JSON 数据的更多信息,请参阅JSON 文件

  • 使用通配符搜索来合并 .pdf 文件中的表时,合并结果的范围限定于在所连接到的初始 .pdf 文件中扫描的页面。有关处理 .pdf 文件中的数据的详细信息,请参见 PDF 文件

  • 无法合并存储过程。

  • 处理数据库数据时,您可以将并集转换为自定义 SQL。

感谢您的反馈!