跳至正文

[新书]可视化构建方法与图形基础(草稿)

标签:

第4章  启示:可视化构建方法与图形基础-25

前面解释了问题分析的过程,问题赋予图形以意义。本章介绍图形的广义构成要素,问题分类与图形类型,并从问题角度介绍增强可视化图形的业务意义的方法。本章概括要点如下:

  • 可视化图形由三个部分构成:坐标空间、可视化视觉模式和可视化意义描述
  • 业务分析应该从传统的三大图形(条形图、折线图和饼图)向分布、相关性等高级图形演化,关注宏观特征,更关注背后的结构性要素
  • 可视化的绘制可以分为四个图层,从主视图构建,增加颜色、大小、标签等数据元素,到增加业务见解与背景信息,循序渐进。
  • 可视化互动的关键是控制分析样本与视图要素,主要有筛选器、集、参数等功能,以及仪表板交互操作

4.1从聚合到图形:图形的广义构成要素

基于3.2小节的聚合,“表哥”“表姐”可以使用Excel把聚合轻松转化为常见的图形:条形图(柱状图)、折线图和饼图,如图4-1所示。图形帮助“数据消费者”更快地获得数据背后的业务逻辑,比如办公用品销售大幅领先、多年销售节节攀高等。

图 4‑1 在Excel中从聚合到基本图形

思考一下,Excel把数据转化为图形时,什么发生了变化,而什么保持不变?认识变化背后的本质和差异,是认识任何事物的关键。

概括而言,从数据到图形的过程中,不变的是问题,以及问题背后的聚合过程;变化的只是数据的展现方式,为枯燥的数字披上了可视化的“外衣”。正是这件“外衣”,提高了问题的易读性,有助于通往业务意义。

从图形的角度看,可视化图形之所以是有意义的,是因为它把数据展示放在了一个空间中,再以“点线面体”这样的模式展示数据点之间的关系,从而帮助数据用户更好的捕捉和领会所要传达的数据意义。

图 4‑2 以折线图为例的基本可视化图形 (右侧增加Excel的可视化)

以上面的折线图为例,通过把各个细分市场、各年度的销售额(12个数据点)放在对应的坐标系空间(由销售额和订单日期构建)中,并以日期为路径把“点”连成“折线”(这个图形的可视化视觉模式),从而让数据用户可以一目了然地获得“各个细分市场销售均持续增长”这样的数据意义。

概括而言,所有的可视化图表都是由坐标空间、可视化视觉模式(点线面构成的图形类型)和可视化意义描述(与业务相关的数据特征)构成的。其中前面两者是可见的,最后的意义虽不可见但可领会,正是这个“只可意会”的部分最终通往决策假设。

看得见的图形与看不见的意义是相互依存的,图形的价值就在于表达意义,而意义要借助图形这一可视化的媒介,二者的关系,犹如像佛像与“菩萨”、共同富裕与“共产主义”;信念引领前进。

1)可视化坐标空间

可视化图形始于坐标空间,其中以二维空间最为常见。多维空间容易引起视觉上的误导,“追求绚烂不应该以增加误导性为代价”,这也是Tableau不推荐、不支持使用立体空间的原因;业务分析师应该尽可能远离来自软件厂家或需求领导的此类引导。

典型的二维空间由横轴(对应列区域)和纵轴(对应行区域)构成。

借助于3.3小节讲解,“第二字段分类创建视图”,如何快速创建图形呢?图形依赖于空间,空间依赖于坐标轴,而只有连续的字段才能创建坐标轴。因此,视图的行列区域,至少要有一个连续的数据字段。

由于Excel、SQL都没有字段连续、离散的预分类方法,这里以Tableau为例介绍,Tableau默认对字段做了两种分类:左侧字段区域位置代表维度和度量,颜色代表连续与离散。

如图4-3所示,行列字段至少有一个连续字段(绿色代表连续),就会构建点、线、面的空间;如果行列字段都是离散字段(蓝色代表离散),那么就会构建“矩阵”(简单理解为表格),而非图形空间。

图 4‑3 不同字段组合构建的二维空间

“离散生成标题,多个离散并列生成分区,交叉生成矩阵;“连续创建坐标轴,多个连续并列、交叉生成矩阵”

喜乐君(草稿)

(任何的高级图形,都是从这个逻辑基础上扩展而来的。有一篇文章非常值得推荐,如下)

上述两种坐标轴(度量坐标轴和日期坐标轴)是最常见的坐标轴;坐标轴还有其他的变种形式,最常见的是饼图中隐藏的“极坐标轴”。饼图使用了为类似于钟表、以圆点为中心的旋转轴,数学中称之为极坐标,它用循环实现连续。

图 4‑4 极坐标系与饼图

很多带有弧度的高级图形都是极坐标的延伸形式,比如南丁格尔玫瑰图,会在第7章简要介绍。

水平坐标轴会有很多种设置的方法,比如双轴、多度量共用坐标轴、倒序坐标轴、对数坐标轴等,会在第5章条形图“坐标轴”部分专门介绍。

2)可视化视觉模式与图形类型

坐标空间提供绘图的位置,接下来就是如何把数据表排列组合,通往数据背后的逻辑意义了。

如图4-5所示。每个数据值都在图形对应单个点,点连成线,线推成面(条形图是长度和宽度构成的面积),点、线、面就构成了最常见的可视化视觉模式。

图 4‑5 点、线、面的可视化视觉要素

可视化图形,可以理解为点、线、面与位置、大小、颜色等视觉“前意识属性”的排列组合。每个数据点可以放在不同位置、可以赋予不同大小、可以赋予彼此相连的路径;每条线可以规定其长度、宽度、斜率等。这样的相互组合和叠加是非常多的。

如图4-6所示,常见的类型如下所示:

  • 点图:气泡图、箱线图、散点图、符号地图、文本表[1]
  • 线图:折线图、“棒棒糖图”、路径地图、关系图
  • 面图:条形图、饼图、面积图、树形图、甘特图(线代表两个时间端)、填充地图、雷达图

图 4‑6 主要可视化图形的点线面分类[喜乐君1] 

重要的不是点线面,而是组合之后的图形样式与人的视觉注意力的匹配程度,能简单有效地辅助决策者通往合理的数据见解,才是最佳图形。长期以往,不断有科学家总结这些规律并持续弘扬,从而形成了一些特定的问题类型,以及其最佳的诠释图形。主要有:

  • 用条形图展示离散字段的排序——部分与部分的排序问题
  • 用折线图描述随着日期的趋势变化——时间序列的波动问题
  • 用饼图展示离散字段相对于整体的比例——部分与整体的比例问题

可见,点线面的视觉模式与图形的类型是紧密结合的,我们可以把它们称之为图形的模式,它们通往对数据的理解——图形的业务意义。

当然,也可以说图形就是由点、线、面构成的,但是这种简单的归纳会让业务分析师失去目标。就像我们不喜欢柏拉图关于人的定义——“人是没有羽毛两腿直立的动物”,感觉生物学的定义也索然无味——“人是灵长目、人科、人属、人种的物种”,而马克思的定义“人是一切社会关系的总和”才让我们回味无穷。因为高尚的定义,揭示了我们为人的高尚,又时刻提醒我们不忘高尚。

带有意义的图形,和点线面的图形也截然不同。

3)可视化意义描述

图形的意义在于展示数据逻辑,本书把它作为可视化图形的重要构成,旨在时刻提醒分析者时刻“不忘初心、牢记业务”。

除了上述的点线面的视觉模式和位置、颜色、大小、形状等“前注意属性”的结合(即可视化视觉模式),可视化还可以借助于注释、说明、交互甚至计算等进一步增加可视化的丰富程度,增加业务描述和见解,辅助领导更快地获得业务线索和辅助假设验证。

比如,在图4-7的条形图中,折线图代表的趋势非常清晰地展示了“过去几年来,不同细分市场的销售额都持续增长”,这是值得赞扬的信号,这就是可视化的意义。

图 4‑7 在可视化图形中增加业务见解

但是,讲解者又借助于“注释”增加了关于利润及其同比的数据说明,虽然“消费者市场”在2020年销售额同比增长了24.3%,但是利润却下滑了8.4%!如今,可视化的意义就变成了,高度重视规模增长背后出现的质量下降的警告。接下来,领导者就知道应该问什么问题了。

这才是可视化的意义,既要关注表面的变化,也要帮助领导发现有助于决策的敏感线索!

可见,业务分析万万不能把图形作为目标,它们只是载体,通常业务理解的载体;可视化分析所要表述的意义才是关键。前几日读到高瓴张磊的书,其中有下面一段:

“一个卖商品的企业家不能光想着‘我的生意是卖商品’,应该想‘我的生意是创造幸福’,而创造幸福的方式之一是卖商品。”

读者可以把“(卖)商品”改为“(做)可视化”重读一遍。


[1] 本书把“文本表”理解为特殊的点图,点的标记类型不是“圆点”,而是“文本”而已。


 [喜乐君1]这个图片考虑单独一页排版


了解 喜乐君 的更多信息

订阅后即可通过电子邮件收到最新文章。

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading