将一个字段拆分为多个字段

如果数据中有包含多个信息单元的字符串字段(例如,客户的名字和姓氏),在将该字段中的值拆分为多个单独的字段的情况下,数据分析起来将更为轻松。您可以使用 Tableau 中的拆分或自定义拆分选项,基于分隔符或字段的每一行中存在的重复值模式来分隔值。在此示例中,常用分隔符为空格字符 ( )。

通过拆分或自定义拆分创建的新字段将以计算字段的方式添加到数据源。

拆分和自定义拆分以 SPLIT 字符串函数为基础。有关详细信息,请参见字符串函数

通过检查字段下拉菜单,您可以判断您的数据是否支持 SPLIT 函数:

  • 在“数据源”页面上,检查“拆分”“自定义拆分”菜单。

  • 在工作表中的“数据”窗格上,检查“转换”>“拆分”“自定义拆分”菜单。

因为不同连接类型支持 Tableau 中的不同功能,所以您可能需要检查这两个地方,以确定您的数据是否支持拆分和自定义拆分选项。

自动拆分字段

可基于 Tableau 在字段中检测到的常用分隔符自动拆分字符串字段。

根据连接类型,拆分可将字段的值自动分隔为最多十个新字段。拆分生成的新字段的数据类型可能因 Tableau 在用于拆分原始字段的分隔符中检测到的模式组合而异。

注意: 在某些情况下,如果拆分在生成新字段时花费的时间太长,或 Tableau 找不到常用分隔符,则会显示自定义拆分对话框。有关详细信息,请参见自定义拆分部分。

自动拆分字段

  1. 在“数据源”页面上的网格中,单击字段名称旁边的下拉箭头。

  2. 选择“拆分”

注意: 您也可以使用工作表内“数据”窗格中的拆分选项。在“数据”窗格中,右键单击要拆分的字段,然后选择“变换”>“拆分”

如果对拆分结果不满意,您可以转到“数据”窗格并编辑拆分创建的计算字段。或者,您可以在 Tableau Desktop 工具栏中单击撤消或移除拆分。

移除拆分创建的字段

  1. 在“数据源”页面上的网格中,单击字段名称旁边的下拉箭头。

  2. 选择“删除”

  3. 重复步骤 1-2 以移除拆分创建的所有字段。

自动拆分的替代项

有时使用自动拆分并不是最好的选择。下面是不应自动拆分字段的一些情况的例子:

  • 值包含不同数量的分隔符:如果分隔符数量因值而异,则无法自动拆分字段。例如,假设某个字段具有以下值:

    jsmith| accounting | north

    dnguyen | humanresources

    lscott | recruiting| west

    karnold |recruiting |west

  • 在这种情况下,请考虑使用自定义拆分。有关详细信息,请参见自定义拆分部分。

  • 值包含混合的分隔符:如果分隔符类型不同,则无法自动拆分字段。例如,假设某个字段包含以下值:

  • smith.accounting

    dnguyen-humanresources

    lscott_recruiting

    karnold_recruiting

    在这种情况下,请考虑使用正则表达式来创建新字段。有关详细信息,请参见其他函数

自定义拆分

可以使用自定义拆分选项来为拆分指定常用分隔符。与拆分选项一样,自定义拆分可将字段的值拆分为最多十个新字段。此外,您可以选择在出现的前 n 个分隔符处、出现的最后 n 个分隔符处或在出现的所有分隔符处拆分值。自定义拆分生成的新字段的数据类型始终会生成字符串数据类型。

使用自定义拆分

  1. 在“数据源”页面上的网格中,单击字段名称旁边的下拉箭头。

  2. 选择“自定义拆分”

注意: 您也可以从“数据”窗格中访问自定义拆分选项。在“数据”窗格中,右键单击要拆分的字段,然后选择“变换”>“自定义拆分”

如果对拆分结果不满意,您可以转到“数据”窗格并编辑拆分创建的计算字段。或者,您可以在工具栏中单击撤消或移除拆分。

移除自定义拆分创建的字段

  1. 在“数据源”页面上的网格中,单击字段名称旁边的下拉箭头。

  2. 选择“删除”

  3. 重复步骤 1-2 以移除自定义拆分创建的所有字段。

总览:使用拆分和自定义拆分

下面列出了您可能需要了解的拆分和自定义拆分额外相关注意事项。

  • 通过拆分或自定义拆分生成的新字段不能用作键来联接表,但可用于混合数据源。

  • 通过拆分或自定义拆分生成的新字段无法在行转置为列中使用。

  • 集、组、参数和数据桶不支持拆分和自定义拆分选项。

  • Microsoft SQL Server 只允许有最多四个拆分字段。

  • 若要生成超过十个新字段,请考虑对以前通过拆分或自定义拆分生成的字段使用拆分或自定义拆分。

拆分和自定义拆分疑难解答

下面列出了您在使用拆分和自定义拆分时可能遇到的问题:

  • 拆分和自定义拆分选项对于支持的数据源类型缺失:拆分和自定义拆分选项只可用于字符串数据类型的字段。

  • 空值或空单元格:创建拆分或自定义拆分后,新字段可能包含空值或完全不包含值。如果所有预期的新字段都没有值,则会出现空值或空单元格。

  • 数据已移除: Tableau 可能使用字段值的部分作为分隔符。如果使用字段值的一部分作为分隔符,那些值将不再出现在新字段中。例如,假设某个字段包含以下值:

  • ZIP-98102

    ZIP-98109

    ZIP-98119

    ZIP-98195

     

    在这种情况下,拆分将创建一个包含以下值的新字段:

    98102

    98109

    98119

    98195

     

    拆分将不会为“ZIP-”创建单独的字段,原因是拆分将其用作分隔符。

感谢您的反馈!