5271724-a9e1197b45a47a75.webp

大数据”与其说是过时了,倒不如说还没有真正开始。只要摩尔定律还在生效,每过18个月电子技术就要翻一番的话,那么大数据时代就只能在路上。这是因为,随着计算技术的不断进步,存储成本的不断降低,人们有越来越多的资本去收集更多的数据,进行更颗粒化的分析。然而,在传统的数据分析中,当数据量大到一定的程度时,分析结果就不会进一步优化了。

举一个最简单的线形分类的例子,对于平面上一堆被零散放置的两种球(红球和蓝球),通过画一条直线尽可能好的将两类球分开,然后对于新的放进来的球(可能被包起来),单凭直线的划分去判断新球的颜色。很容易就可以看出,由于我们分类的模型相当简单(只有一条直线),那么海量的数据可能对于提升模型精度的意义不是太大,这也是传统数据科学遇到的问题。机器学习(数据科学主要的分析手段)方法遇到的主要瓶颈也在这里,在这种情况下,更多的数据是没有更大意义的。

深度学习使得这一瓶颈得到突破,这一学习方法简单来说就是通过多层、多个计算算子进行分析,从而可以建立足够复杂的模型,以提高数据分析能力。这种方法也被称为神经网络,因为每个算子就像神经一样微小而彼此相连,当然这一科学本身并没有仿生学的意义,只是仅仅看上去与神经相类似而已。在这种学习方法下,更大的数据量通常可以带来更高的精度,而且还存在精度从量变到质变提升的可能,因此数据科学家们对数据的需求也突然增大,大数据科学也因此应运而生。

对深度学习的诟病之一,是由于模型开始复杂起来,人们没有办法再像一条直线那样容易理解机器分类的标准规范。当存在理解的黑洞时,机器学习在一部分人眼中也就成了巫术。比如,给模型提供一批好的作文和不那么好的作文,经过学习,机器可以对新的作文进行评分,这些评分仅仅是根据前面提供的素材学习而来的,但是机器无法给出详细的评分理由,这就让结果的信任度大打折扣。不过,近来有关于深度学习算法原理的解释,这可能是把深度学习从“巫术”变成有理论支撑的科学的第一步。

无论怎么说,随着深度学习的快速发展,大数据应该只是仅仅拉开了幕布一角,远没有到全面降临的时刻。而随着深度学习、人工智能(后者往往是以前者为基础的)的快速发展,对数据需求的量级也会越来越多,到那时,可能才是真正的“大数据时代”

相关阅读:

贵州大数据,“后半场”大有可为!  

上海浦东国际机场利用大数据利器 打通打车“最后一公里”  

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-03-09 09:48:38
大数据资讯 原公安部副部长建议立法给大数据所有权确权
近日,全国政协委员、全国政协社会和法制委员会副主任,公安部原副部长陈智敏表示,他将对大数据的所有权立法提出相关提案。他认为,目前的数据所有权不明确,带来的财富分 <详情>
2019-03-08 23:11:35
大数据资讯 大数据+乡村振兴 贵阳有这些亮点
作为全国大数据发展的先行者和领跑者,贵阳在推动大数据与乡村振兴融合方面有何亮点?3月8日,全国两会贵州代表团第二场集中访谈活动现场,面对贵阳市融媒体中心·贵阳网记 <详情>
2019-03-08 23:07:21
大数据技术 上海浦东国际机场利用大数据利器 打通打车“最后一公里”
今年春运期间,为了满足旅客的出行需求,中国民用航空局在上海浦东等10家机场开展了凌晨1点至6点的国内航班夜航试点。上海浦东国际机场大年初六、初七夜航客流量达到了7000 <详情>
2019-03-08 22:51:19
大数据技术 贵州大数据,“后半场”大有可为!
5年来,贵州大数据交出亮眼成绩单,大数据企业8900多家,产值超1100亿元,投入运营及在建的规模以上数据中心达到17个,甲骨文、谷歌、英特尔、微软、IBM、惠普、戴尔、富士 <详情>
2019-03-08 22:14:46
运营商 5G将如何变革各行各业?听听两会代表委员怎么说
全国两会期间,参会代表委员陆续向外界表达了各自关注的重点领域。其中,5G被众多产业界代表委员所关注。马化腾、雷军、孙丕恕、朱华荣、张云勇等代表委员提出与5G相关的提 <详情>