“数据解释”功能中的解释类型

每次您在可视化项或仪表板中选择新标记并运行“数据解释”功能时,Tableau 都会根据该标记和工作簿中的基础数据运行新的统计分析。可能的解释显示在“数据指南”窗格的可展开部分中。有关“数据解释”功能如何分析和评估解释的信息,请参见“数据解释”功能的工作原理

浏览基础值

此部分列出了每个可以解释的度量(称为目标度量)的解释。此处列出的每个解释都描述了与在已分析标记上测试的目标度量值的关系。使用您对数据的真实实际理解来确定“数据解释”功能发现的关系是否有意义且值得探索。

在此示例中,“Trip Distance”(行程距离)是目标度量

基础特征

这些解释描述了视图中标记的基础记录如何对所解释的度量的聚合值产生影响。标记属性可以包括极端值Null 值记录数或标记的平均值

注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)

极端值

此解释类型指示一个或多个记录的值是否明显高于或低于大多数记录。如果模型支持该解释,则表明极端值正在影响已分析标记的目标度量。

当标记具有极端值时,并不自动意味着它具有离群值或者您应将这些记录从视图中排除。怎样选择由您根据分析自行决定。解释只是指出标记中一个极端值。例如,它可能会显示记录中一个输入错误的值,即一根香蕉的成本为 10 美元,而不是 10 美分。或者,它可能会显示一名特定销售人员在某个季度的表现特别出色。

注意:此解释必须由作者启用才能在已发布工作簿的查看模式下可见。有关详细信息,请参见控制对“数据解释”功能的访问

此解释显示:

  • 已分析标记中的基础记录数。
  • 对目标度量值产生影响的一个或多个极端值。
  • 标记中值的分布。
  • 与每个分布值对应的记录详细信息。

探索选项:

  • 将鼠标悬停在图表中的圆上以查看其对应的值。
  • 选择详细信息列表下方的向左或向右箭头可滚动查看记录详细信息。
  • 如果可用,选择“查看完整数据”,然后选择“完整数据”选项卡以查看表中的所有记录。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 如果记录数较少,请检查这些值与极端值的比较。
  • 如果极端值明显高于或低于其他记录值,则排除它并考虑它如何改变已分析标记的值。
  • 在考虑有和没有极端值的数据时,以此为契机,应用您对数据的实践知识。

 

在此示例中,租用 463 小时的单个极端值导致总租用时间的总和高于预期的 613 小时。

造成如此高值的一个可能原因是,有人在归还自行车时忘记将自行车停靠。在这种情况下,作者可能希望排除此值以供将来分析。

 

可视化差异

本节显示:

  • 排除极端值后,已分析标记值如何变化。

 

 

 

 

 

 

 

探索选项:

  • 选择“打开” 图标以查看可视化项的更大版本。
  • 探索有和没有极端值(或多个极端值)的差异。
  • 作者可以将视图作为新工作表打开,并应用筛选器以排除极端值。

分析的后续步骤:

  • 如果极端值明显高于或低于其他记录值,则排除它并查看它如何改变已分析标记的值。
  • 在考虑有和没有极端值的数据时,以此为契机,应用您对数据的实践知识。
 

在此示例中,当排除极端值 483 时,与视图中的其他标记相比,已分析标记不再高。其他标记现在会很突出。作者可能想要探索其他标记,以考虑为什么这些其他地点的自行车租赁时间更长。

Null 值

Null 值解释类型指出标记中缺失数据量高于预期的情况。它指示为 null 的目标度量值的比例,以及 null 值可能如何影响该度量的聚合值。

此解释显示:

  • 已分析标记(蓝色圆圈)的目标度量中为 null 的值的百分比。

探索选项:

  • 在散点图中将鼠标悬停每个圆圈上可查看其详细信息。
  • 滚动查看更多图表。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 可选择排除标记中的 null 值以进行进一步分析。
 

在此示例中,目标度量中的 null 值百分比显示为蓝色圆圈。

记录数

这种解释类型描述了基础记录的计数何时与总和相关。分析发现标记中聚合的记录数与标记的实际值之间存在关系。

虽然这看起来很明显,但这种解释类型可帮助您探索标记的值是否受到其记录中值的大小的影响,或者仅仅是因为已分析标记中的记录数而受到影响。

此解释显示:

  • 已分析标记(深蓝色条形)的目标度量中的记录数。
  • 源可视化项中其他标记(浅蓝色条形)的目标度量中的记录数。

探索选项:

  • 将鼠标悬停在每个条形上可查看其详细信息。
  • 滚动查看更多图表。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 比较记录的单个值是低还是高,或者已分析标记中的记录数是低还是高。
  • 作者,如果您对大量记录感到惊讶,您可能需要对数据进行标准化。
 

在此示例中,针对“Ride Month”(骑行月)的每个值列出了“Trip Distance”(行程距离)的记录数,这是原始可视化项中的一个维度。八月的总行程距离值最高。

您可能会探索八月的行程距离值最高是否是因为八月的骑行次数更多,还是因为某些骑行时间更长导致行程距离最高。

标记的平均值

这种解释类型描述了度量的平均值何时与总和相关。比较平均值是低还是高,或者记录数是低还是高。

此解释显示:

  • 源可视化项中使用的维度的每个值的目标度量的平均值。

探索选项:

  • 将鼠标悬停在每个条形上可查看其详细信息。
  • 滚动查看更多图表。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 比较平均值是低还是高,或者记录数是低还是高。例如,利润高是因为您卖了很多东西还是因为您卖了昂贵的东西?
  • 尝试弄清楚为什么已分析标记具有明显更高或更低的平均值。

 

 

在此示例中,八月的平均行程距离与大多数月份相比并没有显著提高或降低。这表明八月的行程距离更高是因为八月的骑行次数更多,而不是人们的骑行时间更长。

 

产生影响的单一值

使用此解释来了解构成已分析标记的记录值的组成。

这种解释类型确定非可视化维度中的单个值何时可能对已分析标记的聚合值造成影响。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。

此解释表明何时某个维度的每个基础记录具有相同的值,或者何时某个维度值因许多或少数记录对于已分析标记具有相同的单个值而很突出。

注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)

此解释显示:
  • 已分析标记(蓝色条形)与源可视化项中的所有标记(灰色条形)的维度的单个值的记录数百分比。
  • 已分析标记(蓝色条形)与源可视化项中的所有标记(灰色条形)的维度的所有其他值的记录数百分比。
  • 已分析标记(蓝色条形)与所有标记(灰色条形)中某个维度的单个值的目标度量的平均值。
  • 已分析标记(蓝色条形)与源可视化项中的所有标记(灰色条形)的维度的所有其他值目标度量的平均值。

探索选项:

  • 将鼠标悬停在每个条形上可查看其详细信息。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 使用此解释来了解构成已分析标记的记录值的组成。
  • 作者可能想要创建一个新的可视化项来探索本解释中出现的任何未可视化的维度。
 

在此示例中,统计分析表明,许多次骑行来自 Back Bay 车站附近。请注意,“Station Neighborhood”(车站附近)是一个未可视化的维度,它与源可视化项的基础数据中的“Trip Distance”(行程距离)有某种关系。

 

主要促成因素

使用此解释查看构成已分析标记的最大部分的值。

对于 COUNT 聚合,主要促成因素显示具有最多记录的维度值。对于 SUM,此解释显示具有最大部分和的维度值。

 

产生影响的维度

使用此解释来了解构成已分析标记的记录值的组成。

这种解释类型表明,未可视化维度的分布可能对已分析标记的聚合值产生影响。这种类型的解释用于目标度量总和、计算及平均值。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。

注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)

此解释显示:
  • 源可视化项中已分析标记(蓝色条形)维度的所有值的记录数与所有标记(灰色条形)维度的所有值的百分比。
  • 已分析标记(蓝色条形)某个维度的所有值与所有标记(灰色条形)某个维度的所有值的目标度量平均值。

探索选项:

  • 将鼠标悬停在每个条形上可查看其详细信息。
  • 滚动查看更多图表。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 使用此解释来了解构成已分析标记的记录值的组成。
  • 作者可能想要创建一个新的可视化项来探索本解释中出现的任何未可视化的维度。
 

在这个例子中,统计分析表明,与整体评分相比,从南部车站和 MIT 骑行的次数更多,从 Charles Circle 和 Kendall 骑行的次数更少。

请注意,“Station Name”(车站名称)是一个未可视化的维度,它与源可视化项的基础数据中的“Trip Distance”(行程距离)有某种关系。

 

产生影响的度量

这种解释类型表明,未可视化度量的平均值可能对已分析标记的聚合值产生影响。非可视化度量是存在于数据源中,但当前未在视图中使用的度量。

这种解释可以揭示未可视化度量与目标度量之间的线性或二次关系。

注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)

此解释显示:
  • 目标度量的总和与视图中已分析标记(蓝色圆圈)和所有标记(灰色圆圈)的未可视化度量的平均值之间的关系。
  • 如果目标度量的总和高或低,因为未可视化度量的平均值高或低。

探索选项:

  • 将鼠标悬停每个圆圈上可查看其详细信息。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 作者可能想要创建一个新的可视化项来探索本解释中出现的任何未可视化的度量。
 

在这个例子中,行程距离很长的一个可能原因是平均租用总时间也很长。

其他要探索的内容

此部分提供了已分析标记独特或不寻常的可能原因。这些解释:

  • 不会解释为什么这个标记的值之所以是值的原因。
  • 与源可视化项中的度量值没有任何关系。
  • 不考虑任何目标度量。

其他感兴趣的维度

使用此解释来了解构成已分析标记的记录值的组成。

与视图中所有其他标记的值分布相比,已分析标记中未可视化维度的分布是不寻常的。非可视化维度是存在于数据源中,但当前未在视图中使用的维度。

注意:有关解释中常用术语的定义,请参见解释中的术语和概念(链接在新窗口中打开)

此解释显示:
  • 源可视化项中已分析标记(蓝色条形)维度的所有值的记录数与所有标记(灰色条形)维度的所有值的百分比。

探索选项:

  • 将鼠标悬停在每个条形上可查看其详细信息。
  • 滚动查看更多图表。
  • 选择“打开” 图标以查看可视化项的更大版本。

分析的后续步骤:

  • 使用此解释来了解构成已分析标记的记录值的组成。
  • 作者可能想要创建一个新的可视化项来探索本解释中出现的任何未可视化的维度。
 

在此示例中,很大比例的记录与阴天天气相关。因为数据是关于波士顿的自行车租赁,并且已分析标记是八月的行程距离,我们可以假设天气通常温暖潮湿。人们可能会在阴天更频繁地租用自行车,以避免炎热。八月也有可能有更多的阴天。

 

感谢您的反馈!您的反馈已成功提交。谢谢!