五月里不断发生一些的事件和出版的书籍将对数据、人工智能和分析世界产生深远的影响。这些事件和书籍涵括了应该(和不应该)做决定的方式以及领导者应如何塑造一个可持续的数据驱动文化等等各方面。下面我们快速回顾一下在过去一个月可能错过了的东西。
分析是数字转型的关键
如果读者从事技术工作,那么Gartner峰会应该是你不希望错过的活动,Gartner峰会通常充满了新的研究和惊喜。今年的数据与分析峰会定不会让雄心勃勃的首席数据官(CDO)失望。
根据研究公司Gartner的数据,拥有面向业务的关键绩效指标的CDO可以:
有效地持续产生明确的商业价值的可能性为1.7倍 有效缩短上市时间的可能性为2.3倍 在数据货币化方面做到有效的可能性为3.5倍
这对于那些认为数据应该成为其组织转型中心的人来说是个好消息。在过去的一年半里,CDO有机会塑造和推动他们公司的议程。其中72%的人表示,他们正在领导或大量参与数字化转型计划。
然而,那些知道如何将数据作为一种资产进行管理并利用它来推动创新的组织只是例外,而不是常规。
根据《哈佛商业评论》特别提到的一项调查,近七成的组织中仍在挣扎:
只有29.2%的高管的报告说取得了转型业务成果 30%的人报告说已经制定了一个明确的数据战略
也许更令人担扰的是,“数据驱动能力”据说在下降;同一调查表明,受访者认为他们的组织是数据驱动型组织从37.8%降到24%,下降超过13个百分点。
那现在怎么办呢?
也许过去的战略已经无效了。也许,快速的技术颠覆对许多人来说挑战性太大了以至于无法应付,因为需要不可思议的转变,数据库管理就是一个很好的例子。这种不可思议的转变在今年的峰会上表示:
2020年数据库管理系统市场总收入增长的86%基于云 到2023年,75%的数据库将在云平台上运行
如果你的公司在未来24个月内存储和使用数据的方式将发生巨大变化,你需要建立什么能力来利用这一新的发展呢?
我笔者曾有机会与一些通过数据获得突破的企业领导人和数字原生代合作过并研究过他们的成功。我其实也没有什么神奇的公式,但我观察到“数据领导者”所表现出的至少3个特征,在这里分享一下。
3个特征为:
数据即“才能” 数据即生态系统 数据即运行公司决策系统的结构
数据即才能
你会发现围绕“数据文化”和合理决策科学存在很多资源。关于这个主题的书实际上是上个月出版的,是我最近最喜欢的书:《Framers》和《Noise》,《Framers》的作者是Francis de Véricourt、Kenneth Cukier和Viktor Mayer-Schönberger,《Noise》的作者是Daniel Kahneman、Olivier Sibony和Cass R. Sunstein。这两本书都是雄心勃勃的数据管理人员必读之作。
这些书中的知识与诸如分析培训及“数据导师”等最佳实践结合起来就可以帮助企业建立“数据文化”的基础。不过,要评估维持这种文化的机会可以用到的一个好方法,那就是计算你的组织雇用“数据人”的百分比。
考虑一下这样的场景:领导者经常说,他们的竞争优势的来源是他们手下的人,而不仅仅是他们的产品或服务。如果这是真的,那么判断你公司的核心竞争力的好方法就是看看你的员工和他们的职能。
上个星期的报道指星展银行首席执行官Piyush Gupta曾就这个话题发表过看法,他是这样说的,“我们现在越来越觉得自己是一家提供金融服务的技术公司,而不是一家传统银行”。我们的工程师人数是银行家人数两倍”,这一事实也许证明了我们公司质的转变。
我在月初就相关话题发布了一项LinkedIn问卷调查,问的问题是“你应当雇用占你公司总员工人数多少百分比的数据员工”。该问卷调查受到广泛关注,浏览次数接近80,000,投票次数为625。
你应该雇用占总雇员人数多少百分比的“数据雇员”?(Bruno Aziza on LinkedIN)
接受问卷访问之一的是受人尊敬的数据科学家、加州理工学院的Kirk Borne博士,他就“数据雇员”一词提供了有用的指导。他表示:
大约100%的员工应该具备数据知识(即“认识、理解和‘谈论’数据”) 三分之一的员工应该是“数据流利的”(即“用数据分析、创造论据和展示结果”) 少于10%的员工应该是数据专业人员或 是“从组织的数据资产中创造价值的受薪人员(数据科学家、数据分析师、BI专家、数据AI ML工程师、数据库数据仓库工程师)”
读者公司目前的比例是多少呢?建立“数据文化 ”需要书籍、培训、不间断的强化和墙上的各种海报。但数据文化是由你公司的组织结构图来维持的。所以要务必确保你的各种数字与你的雄心壮志相匹配。
数据即生态系统及相互连接的“数据网络”威力
建立“数据文化”时另一个重要的考虑因素是你的员工所接触到的数据类型。领导者们长久以来一直都在抱怨员工难于接触到他们公司的生产数据。不幸的是,这只是问题一个小小的部分。
伦敦劳埃德银行的数据产品主管Nick Blewden上个星期在网上的分享指,“数据近视”这个问题可能比你想象的还要严重。他发布的图片(下图)说出了全部情况:红点是你公司的数据(同样,你的团队可能很少看到今天这些数据),灰色区域是你可以看到的数据。
所有这些都指向一个值得关注的趋势:数据交换的崛起。我有机会在过去的一周里在DM电台播客里分享我对这个话题的看法,DM电台播客由Bloor集团的首席执行官Eric Kavanagh主持,可以在网上收听。而在宏观层面上,我们应该知道,最前卫的公司将数据视为一个“生态系统”机会,洞察力则来自于相互连接的“数据网络”所产生的数据组合。看看如下的数据
根据Gartner的资料,数据分析领导者已经定出了他们的三大优先事项:1)数据质量(51%)2)D&A投资的ROI(44%)3)数据共享(43%)。 Gartner还预测,到2023年,促进数据共享的组织将在大多数商业价值指标上优于同行。 Deloitte的研究表明,92%的受访者希望他们的公司增加对外部数据源的使用。
然而……目前只有5%的数据共享项目能正确识别可信数据和定位可信数据源。这也导出了我的第三个话题:数据结构。
数据即结构
“数据结构”这个词不是个新词。据维基百科介绍,这个词已经存在至少20年了,它的含义也在也被修改了多次。今年Gartner发布2021年十大数据和分析趋势时,这个词获得了巨大的关注。研究公司Gartner预测,数据结构大可:
减少30%的设计时间 减少30%的部署时间 减少70%的维护时间
值得注意的是,数据结构(Data Fabric)一词目前处于研究公司的数据管理炒作周期顶端,在这一阶段,客户的期望和解决方案的现实之间存在着大差距。这些预测的内容很多,要进一步了解什么是数据结构什么不是,请参考Gartner的研究。
各个企业寻求部署数据结构,业界对其根本原因已有了很好的了解:由于数据越来越趋向于分布式(跨越数据湖、数据集市和数据仓库),类型(结构化、非结构化)和位置(在企业内部及跨云)高度多样化,数据和分析领导者面临着在不做重大取舍的前提下管理数据访问和治理的挑战。
在IT部门不能有效地管理数据及用户不能及时访问他们需要的信息时,创新就会受到影响。根据最近的维度数据(Dimensional Data)研究调查结果,68%的数据分析师有推动利润的想法但没有时间去实施。
该领域里越来越多的分析师指导可以有助于你形成自己的观点:一个很好的资源是IDC公司一个文档,关乎IDC称之为“数据控制平面”概念。
前文提到的书的作者Chandana Gopal、Stewart Bond和Dan Vesset很好地解释了这种跨整合、跨访问、跨治理和保护的新架构,解释提出了其中三层的作用,即:
智能层——用于数据概况、分类、质量、位置、脉络和背景的透明度 治理层——政策引擎,目的是控制数据的可访问性、移动性、可用性和保护性 数据工程层——用于数据集成、摄取和转换、内存数据虚拟化、联合、复制和流式