了解多事实关系数据模型的工具提示

注意:对于单表数据源或者单基表数据源,所有表都是相关的。本页上的所有内容均指多基表数据源。

字段级相关性

具有多个基表的数据模型在表之间的相关(或不相关)方式上具有很大的灵活性。的相关性是一个基于数据模型的常数。然而,字段在可视化项中的关联性取决于哪些字段处于活动状态(即,工作表功能区上哪些字段用作胶囊)。在单个可视化项级别,Tableau 会成对评估活动字段以确定它们彼此之间如何相互关联

字段上不相关的图标 不相关图标 表示该字段与可视化项中的至少一个其他字段不相关。此图标可以显示在功能区上或“数据”窗格中的胶囊中。(在某些情况下,可能会有相关图标 。)将鼠标悬停在图标上会打开包含更多信息的工具提示。不同类型的字段相关性有不同的消息:

  • 不相关的维度-维度对
  • 不相关的维度-度量对
  • 拼接维度
  • 共享表中的度量
  • 不相关的筛选器对

根据字段是在功能区上使用还是在“数据”窗格中使用,消息也会略有不同。

  • 在功能区上:功能区上胶囊的工具提示提供了相关信息,显示可视化项中的字段如何相互关联,以及这对 Tableau 如何计算结果产生的影响。
  • 在“数据”窗格中:数据窗格中字段的工具提示提供了有关如果将该字段添加到可视化项中发生什么情况的信息。如果“数据”窗格中的字段与可视化项中的任何字段都不相关,也可以使用浅灰色文本淡化这些字段。

提示:在 Tableau 中,聚合维度(例如 ATTR(维度)或 MIN(维度))的作用类似于度量。

了解您的数据模型

无论何时使用包含多事实关系的数据模型,在“数据源”页面上定期引用该模型都会很有用。本主题中的示例基于具有两个基表(“Classes”(班级)和“Clubs”(俱乐部))和两个共享标签(“Students”(学生))的数据模型。

具有两个基表(“Classes”(班级)和“Clubs”(俱乐部))和一个共享表(“Students”(学生))的数据模型

Classes(班级)

Clubs(俱乐部)

Students(学生)

查看“Classes”(班级)表的数据,显示三个字段及其值查看“Clubs”(俱乐部)表的数据,显示三个字段及其值查看“Students”(学生)表的数据,显示三个字段及其值

字段:

  • Classes(班级):一个维度,其值为“Nesting Basics”(筑巢基础)、“Advanced Songs”(高级歌曲)、“Flying for Fledglings”(雏鸟飞行)和“Alarm Calls 101”(报警电话 101)
  • Length(长度), 一个度量
  • Student(学生),用于与“Students”(学生)表关联的维度

字段:

  • Clubs(俱乐部),一个维度,其值为“Photography”(摄影)、“Travel”(旅行)、“Juggling”(杂耍)、“Art”(艺术)和“First Aid”(急救)
  • Dues(会费), 一个度量
  • Student(学生),用于与“Students”(学生)表关联的维度

字段:

  • Bus Rider(巴士乘客),一个维度,其值为“yes”(是)或“no”(否)
  • Student(学生),一个维度,其值为“Finch”(雀类)、“Cardinal”(红衣凤头鸟)、“Sparrow”(麻雀)、“Robin”(Robin) 和“Jay”(松鸦)。用于与基表关联
  • Age(年龄), 一个度量

不相关的维度-维度对

不相关的维度是交叉联接的,这可能导致跨标题的维度成员组合不能反映基础表中数据的实际组合。

不相关的维度-维度对的消息为:

  • 在功能区上Unrelated dimensions show all possible combinations of values. Unrelated to: <list of dimensions>
  • 在“数据”窗格中If used, this dimension will show all possible combinations of values with unrelated dimensions: <list of dimensions>
  • 在“数据”窗格中显示为灰色This dimension isn't related to any dimensions in the viz. If used, it will show all possible combinations of values with other unrelated dimensions.

交叉联接可能是开销很大的操作,会对性能产生负面影响。因此,如果您向可视化项添加不相关的维度,Tableau 也会显示相关性警告对话框

拼接维度

尽管从分析角度来看,单独可视化不相关的维度是有原因的,但是对于使用多个基表的分析来说,一个常见的“好方法”是另外使用拼接维度。在存在拼接维度的情况下,不相关的维度不再是交叉联接,而是外部联接。外部联接仍可能引入 null 值,但维度成员标题会从所有可能的组合精简为与外部联接至少一侧相关的组合。它们也不会像交叉联接那样对性能产生同样大的影响。如果没有需要不相关图标的其他相关性问题,则拼接维度会显示相关图标

拼接维度的消息为:

  • 在功能区上This dimension stitches together the following fields: <list of fields>
  • 在“数据”窗格中If used, this dimension will stitch together the following fields: <list of fields>
  • 在“数据”窗格中显示为灰色:不适用,拼接仅发生在可视化项中

比较不相关维度与拼接维度

不相关:交叉联接

拼接:中间内部联接的外部联接

交叉联接,每个“Classes”(班级)和“Clubs”(俱乐部)的组合占一行

一个可视化项,显示了“Classes”(班级)和“Clubs”(俱乐部)的交叉联接,其中行代表“Advanced Songs”(高级歌曲)/“Alarm Calls 101”(报警电话 101)/“Flying for Fledglings”(雏鸟飞行)/“Nesting Basics”(筑巢基础)与“Art”(艺术)/“First Aid”(急救)/“Juggling”(杂耍)/“Photography”(摄影)的每个组合。

学生班级和学生俱乐部结果的外部联接

一个可视化项,显示了学生-班级内部联接和以及学生-俱乐部内部联接的外部联接结果。并非所有班级和俱乐部的组合都有代表,并且没有班级的学生和俱乐部也有行。

关于如何计算度量值的补充

当某个度量与某个维度不相关时,它就不能按该维度的成员进行细分(也就是说,当俱乐部没有班级长度时,您不能细分每个俱乐部的平均班级长度)。相反,度量将在与视图中的维度成员标题不同的级别上进行聚合。

维度和度量的术语

在 Tableau 中,度量聚合—它们聚合到由视图中的维度设置的粒度。因此,度量的值取决于维度的上下文。例如,“谷物食品盒的数量”取决于我们指的是总库存还是每个品牌的盒数。

维度通常是分类字段,例如国家/地区或品牌。在 Tableau 中,维度设置视图的粒度,即详细级别。我们通常希望根据某种类别的组合将数据分组为标记。我们用来构建视图的维度确定我们有多少个标记。

聚合是指数据的组合方式。Tableau 的默认聚合为 SUM。您可以将聚合更改为其他选项,其中包括“平均值”、“中值”、“不重复计数”、“最小值”等。粒度指的是度量的详细程度或细分程度 — 由相关维度控制。除非度量的粒度是行级(又称解聚),否则其值必须是聚合的。

示例

五种品牌、三种包装盒尺寸的谷物食品包装盒数量数值表

“谷物食品包装盒数量”的值是?

嗯,这取决于聚合类型和维度设置的粒度。

  • 聚合
    • 总和(或总计)
    • 平均值
  • 粒度:
    • 表范围/完全聚合(示例中的蓝色条形)
    • “Brand”(品牌)维度细分(示例中的彩色条形)

包含四个可视化项的仪表板,一个用于显示表范围内的盒数总和 (54),一个用于显示表范围内的平均盒数 (6),然后这两个版本的可视化项按五个品牌细分

度量值跟随维度成员

度量的值由其相关的维度确定。没有相关维度的度量是表范围的。具有相关维度的度量按相关维度的成员细分(即,为每个维度成员计算度量的值)。如果由于存在不相关的维度而导致相关维度的成员重复,则度量的值将根据其维度成员重复。

  1. 没有维度的度量的表范围是其总体值。

  2. 仅在不相关维度存在的情况下,度量是表范围的,并且对不相关维度的成员重复。

  3. 在存在相关维度的情况下,度量会被更精细地细分,并且其值将根据相关维度的每个成员进行计算。

  4. 当存在不相关维度和相关维度时,度量将按其相关维度进行细分。只要这些相关维度成员在不相关的维度中重复出现,度量值就会随其相关维度成员一起出现。

    因为会费是按俱乐部计算的,所以每次俱乐部重复时,每个俱乐部的会费值也会重复。

不相关的维度-度量对

度量的消息为:

  • 在功能区上This measure can't be broken down by unrelated dimensions: <list of dimensions>
  • 在“数据”窗格中If used, this measure won't be broken down by unrelated dimensions: <list of dimensions>
  • 在“数据”窗格中显示为灰色This measure isn't related to any dimensions in the viz. If used, it won't be broken down.

维度的消息为:

  • 在功能区上This dimension can't break down unrelated measures: <list of measures>
  • 在“数据”窗格中If used, this dimension won't break down unrelated measures: <list of measures>
  • 在“数据”窗格中显示为灰色This dimension isn't related to any measures in the viz. If used, it won't break down measure values.

可视化项中的结果是跨不相关维度值的度量的重复值。此行为类似于使用 LOD 表达式将度量的聚合级别设置为与可视化项的原始粒度不同的详细级别。不相关维度本质上被排除在度量的聚合值计算之外。

共享表中的度量

当使用共享表(如“Students”(学生))中的维度时,它会将来自其他不相关的表(如“Classes”(班级)和“Clubs”(俱乐部))的维度拼接在一起。但是,如果您不使用维度,而是使用“Students”(学生)表中的度量,结果会怎样? 

具有两个基表(“Classes”(班级)和“Clubs”(俱乐部))和一个共享表(“Students”(学生))的数据模型

度量不能拼接。此外,它们的值由其相关维度确定。当不相关的维度一起可视化时,度量值不能同时按这些维度细分。在这种情况下,我们将该度量视为与维度组合不相关,即使它与任一维度单独相关。

跨不相关维度共享的度量的消息为:

  • 在功能区上This measure can't be simultaneously broken down by the following combination of dimensions: <list of dimensions>
  • 在“数据”窗格中If used, this measure won't be broken down by the following combination of dimensions in the viz: <list of dimensions>

为了解决这个问题并防止度量被限制在表范围内,可以拼接不相关的维度,或者移除一个或多个维度,直到存在用于聚合度量的明确关系路径。

相关度量

当某个度量与可视化项中的某些维度相关但与其他维度不相关时,该度量的工具提示中可能会显示一条附加消息,解释其与哪些维度相关。这有助于解释该指标是如何聚合的。仅当度量也与可视化项中的维度不相关时,才会显示此消息。否则,标准行为是将度量聚合到其相关度量的详细级别。

  • 在功能区上This measure is aggregated to the level of detail of related dimensions: <dimensions in the viz this measure is related to>
  • 在“数据”窗格中If used, this measure will be aggregated to the level of detail of related dimensions: <dimensions in the viz this measure is related to>

此消息旨在帮助识别在计算度量值时要考虑哪个或哪些维度。在俱乐部和会费及班级的示例中,度量的工具提示阐明了该值是在俱乐部的详细级别上汇总的,并在班级维度上重复。

筛选器

与可视化项中其他活动字段相比,还会评估筛选器功能区上的字段的相关性。

当筛选器与可视化项中的至少一个字段不相关时,将显示图标和工具提示。筛选器字段和可视化项中的字段均有工具提示。

不相关筛选器的消息为:

  • 在筛选器功能区上This filter doesn't apply to unrelated fields: <fields>
  • 在可视化项中This field isn't filtered by unrelated filters: <fields>
  • 在“数据”窗格中If used, this field will be ignored by unrelated filters: <fields>

筛选器的行为还取决于它们与可视化项中其他字段的相关性。筛选器不会影响与其不相关的字段的值。除非将筛选器设置为无值(排除所有内容或不包含任何内容),否则对于与筛选器无关的任何字段,可视化项都将保持不变。但是,取消选择筛选器中的每个选项将返回一个空白的可视化项。

具有不相关筛选器的可视化项,表明取消选择交互式筛选器控件中的选项不会对可视化项产生影响

带有不相关筛选器的可视化项的两个屏幕截图,显示取消选择交互式筛选器控件中的选项不会影响可视化项

相关字段按预期进行筛选。在具有相关和不相关字段组合的更复杂的可视化项中(例如在拼接上下文中),筛选器只会影响与筛选器字段相关的值。

感谢您的反馈!您的反馈已成功提交。谢谢!