“数据解释”功能中的解释类型
每次您在可视化项或仪表板中选择新标记并运行“数据解释”功能时,Tableau 都会根据该标记和工作簿中的基础数据运行新的统计分析。可能的解释显示在“数据指南”窗格的可展开部分中。有关“数据解释”功能如何分析和评估解释的信息,请参见“数据解释”功能的工作原理。
浏览基础值
此部分列出了每个可以解释的度量(称为目标度量)的解释。此处列出的每个解释都描述了与在已分析标记上测试的目标度量值的关系。使用您对数据的真实实际理解来确定“数据解释”功能发现的关系是否有意义且值得探索。
基础特征
这些解释描述了视图中标记的基础记录如何对所解释的度量的聚合值产生影响。标记属性可以包括极端值、Null 值、记录数或标记的平均值。
注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)。
极端值
此解释类型指示一个或多个记录的值是否明显高于或低于大多数记录。如果模型支持该解释,则表明极端值正在影响已分析标记的目标度量。
当标记具有极端值时,并不自动意味着它具有离群值或者您应将这些记录从视图中排除。怎样选择由您根据分析自行决定。解释只是指出标记中一个极端值。例如,它可能会显示记录中一个输入错误的值,即一根香蕉的成本为 10 美元,而不是 10 美分。或者,它可能会显示一名特定销售人员在某个季度的表现特别出色。
注意:此解释必须由作者启用才能在已发布工作簿的查看模式下可见。有关详细信息,请参见控制对“数据解释”功能的访问。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,租用 463 小时的单个极端值导致总租用时间的总和高于预期的 613 小时。 造成如此高值的一个可能原因是,有人在归还自行车时忘记将自行车停靠。在这种情况下,作者可能希望排除此值以供将来分析。
| |
可视化差异本节显示:
探索选项:
分析的后续步骤:
| 在此示例中,当排除极端值 483 时,与视图中的其他标记相比,已分析标记不再高。其他标记现在会很突出。作者可能想要探索其他标记,以考虑为什么这些其他地点的自行车租赁时间更长。 |
Null 值
Null 值解释类型指出标记中缺失数据量高于预期的情况。它指示为 null 的目标度量值的比例,以及 null 值可能如何影响该度量的聚合值。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,目标度量中的 null 值百分比显示为蓝色圆圈。 |
记录数
这种解释类型描述了基础记录的计数何时与总和相关。分析发现标记中聚合的记录数与标记的实际值之间存在关系。
虽然这看起来很明显,但这种解释类型可帮助您探索标记的值是否受到其记录中值的大小的影响,或者仅仅是因为已分析标记中的记录数而受到影响。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,针对“Ride Month”(骑行月)的每个值列出了“Trip Distance”(行程距离)的记录数,这是原始可视化项中的一个维度。八月的总行程距离值最高。 您可能会探索八月的行程距离值最高是否是因为八月的骑行次数更多,还是因为某些骑行时间更长导致行程距离最高。 |
标记的平均值
这种解释类型描述了度量的平均值何时与总和相关。比较平均值是低还是高,或者记录数是低还是高。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,八月的平均行程距离与大多数月份相比并没有显著提高或降低。这表明八月的行程距离更高是因为八月的骑行次数更多,而不是人们的骑行时间更长。 |
产生影响的单一值
使用此解释来了解构成已分析标记的记录值的组成。
这种解释类型确定非可视化维度中的单个值何时可能对已分析标记的聚合值造成影响。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。
此解释表明何时某个维度的每个基础记录具有相同的值,或者何时某个维度值因许多或少数记录对于已分析标记具有相同的单个值而很突出。
注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,统计分析表明,许多次骑行来自 Back Bay 车站附近。请注意,“Station Neighborhood”(车站附近)是一个未可视化的维度,它与源可视化项的基础数据中的“Trip Distance”(行程距离)有某种关系。 |
主要促成因素
使用此解释查看构成已分析标记的最大部分的值。
对于 COUNT 聚合,主要促成因素显示具有最多记录的维度值。对于 SUM,此解释显示具有最大部分和的维度值。
产生影响的维度
使用此解释来了解构成已分析标记的记录值的组成。
这种解释类型表明,未可视化维度的分布可能对已分析标记的聚合值产生影响。这种类型的解释用于目标度量总和、计算及平均值。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。
注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)。
此解释显示:
探索选项:
分析的后续步骤:
| 在这个例子中,统计分析表明,与整体评分相比,从南部车站和 MIT 骑行的次数更多,从 Charles Circle 和 Kendall 骑行的次数更少。 请注意,“Station Name”(车站名称)是一个未可视化的维度,它与源可视化项的基础数据中的“Trip Distance”(行程距离)有某种关系。 |
产生影响的度量
这种解释类型表明,未可视化度量的平均值可能对已分析标记的聚合值产生影响。非可视化度量是存在于数据源中,但当前未在视图中使用的度量。
这种解释可以揭示未可视化度量与目标度量之间的线性或二次关系。
注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)。
此解释显示:
探索选项:
分析的后续步骤:
| 在这个例子中,行程距离很长的一个可能原因是平均租用总时间也很长。 |
其他要探索的内容
此部分提供了已分析标记独特或不寻常的可能原因。这些解释:
- 不会解释为什么这个标记的值之所以是值的原因。
- 与源可视化项中的度量值没有任何关系。
- 不考虑任何目标度量。
其他感兴趣的维度
使用此解释来了解构成已分析标记的记录值的组成。
与视图中所有其他标记的值分布相比,已分析标记中未可视化维度的分布是不寻常的。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。
注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)。
此解释显示:
探索选项:
分析的后续步骤:
| 在此示例中,很大比例的记录与阴天天气相关。因为数据是关于波士顿的自行车租赁,并且已分析标记是八月的行程距离,我们可以假设天气通常温暖潮湿。人们可能会在阴天更频繁地租用自行车,以避免炎热。八月也有可能有更多的阴天。 |