中国IDC圈12月5日报道: 我们都知道,预测分析一直是“象牙塔里”统计学家和数据科学家的“特权”,他们远离日常业务决策者。大数据将改变这种状况。

随着越来越多的数据流被放到网上,并整合到现有的BI、CRM、ERP和其他关键业务系统,预测分析最终将成为关注的焦点。虽然大多数客户服务代表和现场销售代表还没有感受到这种影响,IBM和MicroStrategy等公司已经开始行动。

大数据:预测分析不再是统计学家的特权想象一下这样的世界,客户服务代表可以独立决定一个问题客户是否值得保留或者升级,又或者,销售人员可以基于人们对零售商在Facebook或Twitter上的评价来调整零售商的产品量。

大数据将组群分析和回归分析等较常用的工具交到日常管理人员手中,然后他们可以使用非交易数据来做出战略性的长期的业务决定。

然后,大数据并不是要取代传统BI工具,Gartner研究公司的BI分析师Rita Sallam表示,大数据将让BI更有价值和更有利于业务发展,“我们总是会需要看看过去的数据,当你拥有大数据时,你更应该这样做。BI并不会消失,它通过大数据被加强了。”

你如何知道在发现初始阶段看到的预测会随着时间的推移而得到证明呢,例如,在中西部地区,红色钱包真的卖得比蓝色钱包好吗?初步数据分析可能会这样建议,因为上一季度(甚至更早期)红色钱包卖得更多,所以红色钱包卖得更好。

但是这具有相关性,并不存在因果关系。如果你更加仔细地查看——使用从BI工具收集到的历史交易数据,你会发现,实际上是因为最新商家定位活动造成了这样的结果,因为商家将目光都放在红色钱包上。

这也是为什么IBM公司的新兴技术主管David Barnes更倾向于参考来自大数据技术(例如hadoop、map/reduce等)的结果。例如,你不会想基于对Twitter流的情感分析来作出关键业务决策。

分析社交媒体中的非结构数据能够获得直接回报社交媒体存在很大的商机。例如,作为零售商,你发现Justin Bieber的分析非常喜欢他在昨晚演唱会穿的外套,并且有人在Twitter上表示他从你的商店买到了一件,然后你可以快速决定增加那件外套的存货量,因为你知道这件衣服将非常热门,但只是在非常有限的时间内。

如果没有预测分析(PA),你很可能错过这个机会。

“在过去,我们会根据历史数据来做决定,但现在时代不同了,”Barnes表示,“现在我们需要预测分析。”

我们需要结合开源技术(大多数大数据平台都源自开源)、摩尔定律、商品硬件、云计算以及捕捉和存储大量非交易数据的能力来实现预测目的。

通常被认为是大数据背后的驱动力的非结构化数据(例如视频和电子邮件)几乎没有参与这一过程。你可以刷博客和用户论坛,然后将这些信息与地理数据相关联,并结合现有结构化客户数据,和来自Micro Strategy Wisdom引擎(追踪1400万Facebook用户对你的品牌的评价)等新来源的信息,这样你就获得了强大的预测能力。

BI供应商MicroStrategy公司的行业营销主管P.K.Paleru表示,大数据已经发生了两件事情,“你可能给结合不同来源的各种类型的数据,你还可以对所有这些数据进行微优化。”

缩短大数据分析时间信息管理和分析咨询公司New Vantage Partners公司的创始人兼管理合伙人Paul Barth表示,这种分析的一个很大优势在于缩短“回答时间”(TTA),数据科学家曾经需要花几个月时间来建立查询或者模型以回答关于供应链或生产计划的前瞻性业务问题,现在只需要几个小时就可以完成。

这是因为大数据技术允许信息在被优化或者关系化之前进行分析。再加上高级分析技术,让业务经理在非常短的时间内询问和回答问题,不过,现在仍然需要IT员工和数据建模人员伸出援助之手。

“这些人正在使用大数据来自动化机器学习等过程,”Barth表示,这样做可以为每个产品线、每个市场产生20000个数据模型,让用户可以预测未来18个月。“这是一个很大的变化,他们之所以能这样做是因为大数据技术可以自动化很多建模步骤,并可以在无人职守的情况下执行。”

在不久前,这几乎是不可能的,统计分析师需要数周甚至数月来建立单个模型。如果你销售100个产品,你的整个产品线不可能超过1000个模型,这意味着这些模型返回的信息并不是很准确。

大数据分析的黄金时期还未到来虽然这一切让业务用户感到激动,但是大范围普及大数据分析技术并不会那么快发生。Hadoop虽然很强大,仍然只是用于处理海量数据集的“原始”工具。

仔细考虑一下这些预测分析结果的实用性,1亿个人的意见真正超过10万人的意见吗?

“存在大量的重复的数据,”Barth表示,如果你想要正确地进行分析,“你仍然需要聪明的分析师”,幸运的是,大数据为他们提供了非常强大的工具。

 

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>