Posted on

Tableau Tips: 讲讲维度和度量

很多 Tableau 初学者在日常使用过程中,如果对 Tableau 的一些基础概念不牢记心里的话,很容易出现的一种情况就是「凭感觉」去完成一些操作,或者参考范例完成后,在下一次作分析时却得不到要领。

相比于 Excel 这类表格软件,Tableau 提供了拖拽式的结构操作方式,从入门的角度来看,「维度」和「度量」就是 Tableau 初学者最应该摸透的基础概念,再怎么强调都不为过。

注:概念定义取于官方文档,示意数据源使用官方提供的 Salesforce-Example 。

关键概念:维度、度量、蓝色胶囊、绿色胶囊、连续、离散

当我们添加数据源到 Tableau 的时候,Tableau 会根据数据类型自动把字段分为维度和度量两类。如上图,维度中包括区域、日期等,度量中包括赢单率、经纬度等。在示例中,当我们把「实现日期」拖到列数据中,把「收入/销售人员」拖到行数据中,Tableau 会自动帮我们生成一张曲线图,截图中还可以看到两个字段一个是蓝色胶囊、一个是绿色胶囊。

维度

那么 Tableau 是如何自动帮我们把数据字段做区分呢,看回官方文档:

当您第一次连接到数据源时,Tableau 会将包含离散分类信息的任何字段(例如,值为字符串或布尔值的字段)分配给“数据”窗格中的“维度”区域。

当您单击并将字段从“维度”区域拖到“行”或“列”时,Tableau 将创建列或行标题

度量

同理,看回官方文档:

当您第一次连接到数据源时,Tableau 会将包含定量数值信息的任何字段(即其中的值为数字的字段)分配给“数据”窗格中的“度量”区域。

当您将字段从“度量”区域拖到“行”或“列”时,Tableau 将创建连续轴

从根源上来讲,Tableau 初始是根据字段含有离散分类还是定量数值信息来做划分的。举例:用户名、城市名就是离散分类,高考分数、城市 GDP 就是定量数值。

看回下面的图,可以看到「实现日期」作为维度,它呈现为标题,被分配了蓝色胶囊,而「收入/销售人员」作为度量,呈现为连续轴,并且被分配绿色胶囊。但是要注意,颜色只是用来标志字段是否连续或离散,并不意识着维度对应蓝色,度量对应绿色。

例如,当我们把「收入/销售人员」的聚合数据设置为离散的时候,「收入/销售人员」的聚合数据(注意:不是「收入/销售人员」这个字段)变成了行标题,根据聚合结果出现具体的行值。

关于离散和连续,再展开讲讲

连续和离散是数学术语。连续意指“构成一个不间断的整体,没有中断”;离散意指“各自分离且不同”。「连接」理论上无限数值,例如商品价格,有可能是 $1-$100 中任何数值,「离散」意味着有限且不同,如果正方位,只有东、南、西、北 。举个 Tableau 中会使用到的例子:年份。

如果把年份-月份看成连续的,那么它的值是无限的,例如 2017-1,2017-2,2017-3 等无穷尽,但如果把它理解为离散的,那么一年中只有 12 个月份,1 月,2 月,到 12 月。

看到这里大家可能会有一种感觉,数值型的字段一定是连续的,是度量值,其实并不然,例如邮编,我们很少会针对邮编进行数值运算,求个和什么的,所以在 Tableau 分配为度量值时,我们可以手动将其修改为维度。

小总结

所以,针对度量和维度,我们了解了基础概念,同时特别要注意的点:

  • 维度呈现为标题、度量呈现为连续轴(一开始自己都理解错了)
  • 离散字段创建标题、连续字段创建连续轴
  • 辨别视图中的字段是度量还是维度的依据在于该字段是否已聚合
  • 维度和度量是可以相互转化的
  • 离散字段和连续字段也是可以相互转化的
  • 维度/度量和离散/连续不是必然对应的

同时,行文中提及其他关键概念,包括聚合数据等,后续专文总结。

发表评论