数据科学民主化:数据科学家过去往往要准备几个月的东西,数据嗅觉明锐的业务用户只要几天的时间就可以整合在一起。
那些想履行诺言,将机器学习用于数据分析的公司正在求助一个看似爱莫能助的老朋友。它们正在用人工智能对商业智能系统(主要是分析过去绩效的领域)进行改进,使其报告功能具备预测的功能。
Symphony Post Acute Network就是这样一个组织。该医疗公司在伊利诺斯州、印第安纳州和威斯康星州的28家医疗机构中拥有5000张床位,它希望每年都能利用人工智能和机器学习改善护理,以惠及8万从膝盖手术或透析治疗中康复的患者。例如,如果人工智能深挖患者的病历根源可能会发现患者因跌到而危及生命的风险特别高,因此需要额外的预防措施。
如果这些有可能是个人数据点或细微数据模式的指标得以发现的话,它们就是机器学习的理想用例。但是建模并非易事。
Symphony的数据科学兼分析主管Nathan Patrick Taylor说:“人们连珠炮似地问我关于预测的问题。即使我把所有的时间都用来建模,我也分身乏术。”
因此公司聘请了两名数据科学家。Taylor说:“而且他们身价不菲,但是我们并没有因为他们的加入而得偿所愿,这真是费力又烧钱。”
所以两年前,Symphony开始另辟蹊径,去找那些已经拥有机器学习模型并万事俱备的供应商。现在,该公司用采用了数据仓库中已收集的数据,用供应商DataRobot的基于云计算的人工智能引擎来发送数据,结果则以每隔三小时的频率反馈回公司的Microsoft PowerBI仪表板。Taylor说:“我立即就明白了,我的首席信息官也明白了,我们惊讶极了。这看起来很神奇。”
今天,240名医生和护士在PowerBI仪表板中获得了预测和建议,他们可以通过平板电脑和智能手机查看这些仪表板。因此,例如,容易摔倒的患者会自动标有楼梯图标。很可能再次入院的患者则标有救护车图标。
将人工智能注入商业智能
Taylor说,再入院率对Symphony来说非同小可。医院和保险公司会考察再入院率,每次再入院都会花掉公司13,500美元。他说:“这不是一笔小钱”
为了确定DataRobot的预测是否有用,Symphony最初只将DataRobot的反馈推广到一部分设施,并进行了为期6个月的研究,以了解再入院率是否有差异。他说:“如果你能做到1%的变动,那你干得真漂亮。”
Taylor说,比率确实得到了改善——从21%下降到18.8%.他说:“这是一个显著的进步,这赢得了我们的首席执行官的支持。”
如今,该公司开始用同样的方式来考察与保险公司签署的合同。他说:“如果我们不能很好地为服务计费,就会错过很多利润。”
初始安装大约需要20个小时的时间,包括连接数据馈送和建立学习模型。现在,如果有人想要新类型的预测,一个全新的学习模型大约需要六到八个小时的时间才能建立起来,他说,在三个工作日的不同时段完成。
此外,他说现有模型可以随时得到再训练。例如,法规可能会发生改变,或者医务人员可能会开始使用新程序。另外,一个模型可能会随着时间而发生改变。Taylor每隔两个月就重新训练模型,或者每当有重大的政策转变时就这么做。如果发生重大变化,那么学习模式可能只需要在新政策生效后提供的数据上进行培训。
他说,管理系统不再需要训练有素的数据科学家,但它确实需要具有统计基础知识的人员。 Symphony还使用R代码来架设模型。
DataRobot开箱即支持Python.据DataRobot的产品营销总监Colin Priest称,使用其它语言的客户还可以使用任何能理解Rest API的语言(包括Java,C#,SAS,JavaScript和Visual Basic)来调用DataRobot Rest API.
人工智能的下一步是自助式服务
Forrester Research的副总裁兼首席分析师Boris Evelson说:“人工智能已经民主化。直到不久前,它还需要一名数据科学家来编写代码,现在,有了这些商业智能系统,我点击几个数据点就能选择我要预测的变量,比如客户的购买倾向,而且这些预测模型会自动生成。”
他说,过去需要数据科学专家数月才能完成的东西,现在理解数据并使用Excel的人几天就可以整合在一起。
他说:“营销人员正在利用这一点来预测客户行为并据此采取行动,业务管理者正在使用它来考察和预测风险,供应链人员正在利用它来查看和优化物流。”
Forrester最近对全球决策者的调查称,改进数据、分析或洞察平台在人工智能技术的用例中位列三甲。所有主要的商业智能供应商(包括IBM,甲骨文和微软)都致力于此。
如果八小时的时间听起来太长,无法建立一个新的机器学习模型,你还有更多的选择可用。不久之后,用户就能自动获得最常见的预测类型,获得推荐,并拥有内置图像识别和自然语言处理功能,因为Gartner预言,自然语言生成和人工智能将成为一个标准功能,为未来两年内90%的现代商业智能平台所具备。
为文本和可视化分析配备商业智能
SpringBoard.ai的首席执行官Bruce Molloy说,用户需要信息时可以直接用英语提问,自然语言处理使这成为现实。“我认为这是自然的演变。”
他说,领域越狭窄,可供平台使用的数据的相关性越高,供应商就能更轻松地添加人工智能功能。会计平台或Salesforce等客户关系管理系统已经拥有了它们所需的数据,而且有些问题用户很可能会提问。他说:“有了Salesforce,看看人们会做什么,这会很有趣,Salesforce已经受到了限制,而且工作已经完成了一部分,人们已经确定这些想法很重要,他们可以在这些想法上对人工智能功能进行分层。”
增强的处理能力、更智能的算法、云计算和标准接口推动了人工智能的应用。例如,DataRobot同时利用了云计算和标准Rest API,这使它除了能支持Trifacta、Alteryx和Domino Data Labs的商业智能系统外,还支持PowerBI、Tableau、Qlik、Exce、R Shiny和很多其它的仪表板。
由人工智驱动的商业智能仪表板也可以处理比以往更广泛的数据种类。例如,Symphony不只是看病人记录中的具体数据,还会看医生和护士的病人病程记录。
咨询公司Publicis.Sapient的全球数据兼人工智能主管Josh Sutton说,有很多信息以非结构化格式保存,这些信息可能会产生有用的见解或预测。这不仅仅是文本那么简单。
Sutton说:“作为商业智能来源的非结构化数据的大来源之一是视觉图像。例如,营销部门可以根据他们在社交媒体上分享的照片分析他们的客户如何与产品互动,从中受益。
超越描述性分析
但预测和洞察只是人工智能得以添加到商业智能仪表板的第一步,International Data公司的认知和人工智能系统研究总监David Schubmehl这样说道。人工智能驱动的仪表板还可以提供建议,或为用户下一步应该采取的具体措施提出建议——甚至向用户提供能采取这些措施的建议。
他说:“如果微件(widget)的销量下降,这可能会说明这对未来意味着什么,以及你现在应该怎么做。”
这使得商业智能更有价值。
他说:“我认为这就是这么多人采用这种工具的原因”。例如,Salesforce刚刚发布了一项重大声明,称其Einstein最近在预测性智能方面做出每天逾10亿次的预测,这些预测性智能帮助人们做成新业务,发现新的业务线索并创建面向行动的功能。我认为这表明人们需要的不仅仅是描述性业务分析。“
他说,我们仍处于早期阶段。“在接下来的两三年内,我们可能会完全成熟,人们才刚开始理解人工智能和机器学习的潜力。”
埃森哲负责人工智能的资深负责人兼全球负责人Rumman Chowdhury说,特别是人工智能仍然不具备常识。
她说:“我们处在弱人工智能(narrow AI)的世界”。即使特定平台内置了人工智能模型并可以随时得到使用,用户仍然要了解正在使用的数据及其与手头问题的相关性。
她说:“你必须确保它适用于你所得到的输出,我不知道我们是否会完全取代某些领域的人为判断,我不知道我们是否能够实现真正的决策自动化——即便我们必须知道。”