跳至正文

数据观:从“数据金字塔”到Tableau分析工作流

去年在婴贝儿曾经分享过“数据金字塔”模型,严格的说,是“信息-数据-知识和智慧金字塔”;前天在WCH灵光乍现,用这个模型分享了Tableau与业务分析的关系,觉得比之前的诠释更加清晰,因此,重新整理本文,希望帮助更多的人理解以下问题:

  • 数据汪洋之中,如何用四个层次的区分,清晰地理解「数据驱动业务」的真正价值
  • 在「数据驱动业务价值」的流程中,数据分析师和业务经理分别处在什么位置?
  • 为什么Tableau要面向业务人员,而不是面向技术人员

一、理解数据,不可不知“DIKW Pyramid”

从1946年人类第一台计算机诞生,接下来70年计算机技术的迅速发展,人类从数据稀缺,进入了数据爆炸时代。伴随数据爆炸,人类半个多世纪的老问题就是:如何将数据、信息转化为知识,扩大人类的理性,辅助决策?

可以说,从1946年上世纪90年代,辅助决策一直未能有效发展起来,直到关系数据库、数据仓库开始兴起,联机分析、数据挖掘、可视化分析展露头脚,数据辅助决策的大道才开始快速发展起来。1989年,Garner的报告中明确提出了BI商业智能的概念,指“基于事实支持系统用来支撑商业决策的概念与方法”(”concepts and methods to improve business decision making by using fact-based support systems.”),自此之后,BI商业智能的概念和应用遍地开花。

而我们的主角Tableau,就像是押对了趋势,已经连续七年被Garner评为BI领导者地位。

不过,当今中国在数据方面的现状,并不比上世纪九十年代的美国更好,我最爱的管理大师彼得·德鲁克当年的感慨,特别适合于当下的中国:

迄今为止,我们的系统产生的还仅仅是数据,而不是信息,更不是知识。”(Peter Drucker,1990+)

那什么是数据、信息和知识呢?

在《大数据》(涂子沛)一书中,作者举了形象的例子,他说“1.85”是个数据,这个数据置于特定背景,比如“奥巴马身高185cm”,数据就转化为了信息,如果根据更多的数据发现了特定的规律,那么就成为了知识。

屏幕快照 2019-06-10 上午10.17.55.png
感谢Tableau Lele对本图片的贡献 (Jun 10, 2019)

在上面的三层模型中再加入“Wisdom智慧”,就形成了标准的DIKW金字塔模型(下面简称“数据金字塔”)。“DIKW金字塔”清晰地表述了从数据到信息,从信息到知识过程逻辑。每一次数据的加工提升,都是一次答疑解惑和数据增值的过程。

数据金字塔

我们可以几个直白的词语理解这些差别:

  • Data数据:是我们理解事实的符号,比如数字、单位、程度描述等,在你加入其他要素之前,它是无用的,有人专门为此设计了一个词语,叫“Know-nothing”;没有分析的数据其实本事毫无价值;
  • Information信息:信息是加入了理解和目的的数据,多是结构化和功能性的表述;通过信息,我们可以了解数据的意义,因此称之为“know-what”(知道是什么);(”information is defined as data that are endowed with meaning and purpose.”)
  • Kknowledge知识:知识之上,增加了主观的理解,而且因人而异;它和信息的不同在于,知识是直接指导业务和行动的,让大家支付如何去做(how);我们称之为“know-how”。
  • Wisdom智慧/洞见:古人说“玄之又玄是为道”,到了这一层,就融合了数据的深层理解和经验性的洞见,因此也是少有人能到的地方,透析数据,不仅知其然,更知其所以然(why),此乃妙理,即是“know-why”。

二、数据分析师和业务经理的角色与位置

上面我们通过一个模型分析了如何用数据驱动业务成长,或者说,如何将数据、信息转化为知识,扩大我们的理性,辅助决策;接下来,我们要分析一下这个流程中的主体:数据分析师和业务经理,他们分别位于哪个位置?又担负什么责任?

曾经我改了一个图,形象地说明了数据部门和业务部门的普遍关系:业务部门希望置身分析之事外,认为数据部或信息部应该承担“提供我想要的报表和分析”这样的任务;而数据部则因为不了解业务中的很多逻辑关系和场景,导致在数据整理、筛选和分析时无法超越自己的本职和经验局限。数据分析

这样的矛盾经久不衰,我们所有人都见得真真切切。大部分的企业还是深处这样的泥沼之中,数据部门疲于奔命,业务部门步步紧逼。问题出在哪里?

  • 知识和智慧驱动业务,而业务部门才应该生产知识和智慧;
  • 从信息到知识的数据增值过程,需要加入主观的信息、经验和理解,这不是IT数据分析师所能胜任的。

数据分析师与业务的位置 .png

通过上面的图我们可以看出,从信息到知识的升级和增值过程中,需要加入的背景知识是来自于业务部门的。因此从长远来看,数据驱动业务是由业务部门来驱动,而不是由IT或者数据部门来驱动的。为什么知识来自于业务部门,你看何为知识?

“知识是固有知识、价值观、背景信息、专业洞察和现实直觉的不稳定的混合体,它提供了持续评估和接纳新经验与新信息的思维框架。知识来自于每个人的头脑,也因为头脑而实践应用。在企业组织中,知识不仅存在于文件和智囊团中,也存在于组织的行为规则、流程、时间和标准中。”

Knowledge is a fluid mix of framed experience, values, contextual information, expert insight and grounded intuition that provides an environment and framework for evaluating and incorporating new experiences and information. It originates and is applied in the minds of knowers. In organizations it often becomes embedded not only in documents and repositories but also in organizational routines, processes, practices and norms.[8][31]

阻碍“数据赋能业务”的矛盾已经找到,接下来就需要重新界定数据部门和业务部门的角色和关系,从而实现两个角色共同努力,实现“数据赋能业务”,推动从数据到知识,驱动业务发展。

  • 在数据支持决策的路上,不同角色处于不同的位置,边界决定工作性质
  • 数据部门的主要责任是从数据到信息,帮所有人收集、整理、存储、分享数据,同时根据预测模型和经验部分地实现从信息到知识的过渡;
  • 业务部门则要基于业务部门提供的信息,加入部门或个人的经验、分析逻辑形成可以指导行动的知识,这个过程往往特别依赖于人的主观分析,依赖于大尺度的经验,因此数据部门难以替代。

屏幕快照 2019-07-18 下午8.44.52

三、IT驱动向业务驱动转变的长远趋势

如果大家就上面的“数据驱动业务”以及业务角色和位置达成了一致认识,我们就可以清晰地认识到,当数据分析越来越重要,当业务部门意识到自己才是业务分析的主人,当业务人员享受到了数据赋能业务所带来的成果,过去由IT驱动的数据分析就会快速向业务驱动的方向转变。

而这,其实只是Garner多年前的预言,也是很多人还没看清但是已经越来越清晰的事实。如果你想了解更多的趋势,不妨看一下Garner在2018年对未来商业智能做的假设:

1、到2020年,增强分析将成为新的商业智能、分析、数据科学和机器学习平台以及嵌入式分析的主要推动力。

2、到2020年,现代商业智能和分析平台将分化出增强数据(深度学习的常用手段)探索能力,且以2倍左右的速率增长并创造2倍于现在的商业价值。

3、到2020年,90%的现代商业智能平台会把自然语言的生成和人工智能作为标准能力。

4、到2020年,50%的分析查询将通过搜索、自然语言处理或语音生成,或自动生成。

5、到2020年,相关组织将为用户提供一个梳理好的内外部数据目录,可以从中获得两倍于现在的分析投资商业价值。

6、到2020年,平民数据科学家的数量增长5倍于专家数据科学家的数量增长

按照这个趋势,你会发现,从数据到信息的工作会持续自动化;而业务分析科学家会呈倍数增加。Tableau正是理解了这个趋势,并且持续不断地驱动整个分析商业从IT向业务转变,因此,我们应该了解Tableau相关的几个命题:

  • Tableau是为业务人员设计的;
  • Tableau要实现,让提出问题的人去寻找答案。
  • Tableau旨在让人人都成为数据分析师,让每个人都能理解和应用数据。

屏幕快照 2019-07-24 下午4.59.51

四、Tableau,以数据驱动业务未来

对于BI商业智能而言,现在是最好的时代,从数据库、数据挖掘到联机分析、可视化呈现,各项技术都已经日新月异;同样,对于企业的业务经理而言,如今也是最好的时代,依靠Tableau提供的数据整理和BI分析,可以更加高效地加入主观的理解,从而形成指导业务的洞见。庆幸的是,Tableau已经逐步发展成为了企业级的大数据分析平台,从传统优势领域(可视化分析)逐步扩展到敏捷ETL、数据管理、协作分析等领域,不断开发的拓展和SDK生态希望能带来更多的参与者。

屏幕快照 2019-06-06 上午8.10.54.png

现代分析工作流是一个由下图描绘的相互关联的功能构成的循环,其中包含五个关键领域,三个核心角色。“IT是现在分析工作流的实现者,但该工作流的主要推动者确实整个组织内的业务用户和分析师。现在分析工作流的成功实施有赖于所有角色的参与和协作。”(Tableau)

使用完整的Tableau Sever+desktop+prep解决方案,可以帮助IT在大规模组织中广泛部署商业智能和分析平台,实现下图展示的现代分析工作流,以数据赋能整个商业和业务,实现更高效的数据发现和业务成长。

现在分析工作流 .png

具体到业务分析中,通过Tableau Prep、Desktop和Server的组合,Tableau可以搭建完整的大数据分析平台,让数据整理更加简单,帮助更多的业务人员通过Tableau发现洞见。通过Server,Tableau可以帮助企业更高效的实现数据分享和理解。你可以通过下面的这篇文章,了解如何实现搭建从数据到业务的整个数据旅程。

屏幕快照 2019-06-10 上午10.23.19.png

结语

作为Tableau的忠实粉丝,应广大爱好者需求,我开始了Tableau分享之旅,每月定期组织Tableau分享活动(济南)。希望越来越多的人加入到Tableau的大家庭,以技术驱动自我成长,以成长驱动业务改进。一旦开始使用Tableau,很少有人能下这艘船。

Anyone can cook; anyone can analyze.

推荐阅读:

25 Augues 2018, Jinan
Jun 10, 2019 update images and revise something wrong
Jul 24, 2019 update

喜乐君
Tableau Partner
Tableau Desktop & Server QA Certification


了解 喜乐君 的更多信息

订阅后即可通过电子邮件收到最新文章。

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading