我国的工业互联网发展正在从概念的普及进入实践的生根阶段,在这一进程中,数据成为重要的基础性战略资源。大数据的充分挖掘和利用,极大促进了全社会要素资源的网络化共享、集约化整合、协作化开发、高效化利用,推动了中国工业发生重大而深刻的变革,一个全新的大数据时代正在向我们大踏步地走来。

工业数据量激增背景下的数据处理

目前,大数据正处于融合发展和变革创新的重要关口:工业数据量激增,互联网、移动互联网、物联网三大生态顺次发展,使得全球数据总量爆发性增长。到2020年,数据总量将达到44ZB(万亿GB),其中工业数据增速将是其它大数据领域的两倍;软件、网络、装备等各领域间技术频繁发生跨界耦合交融,依托数据的整合作用,推动产品与服务、硬件与软件、应用与平台趋向交融;全球产业格局面临重塑,传统大数据IT企业、自动化企业、制造企业正在成为工业大数据这一新兴领域的领导力量,以融合性技术创新和新兴产业生态体系为标志的产业新格局正在形成中。

工业大数据从来源上主要分为信息管理系统数据、机器设备数据和外部数据。信息管理系统数据是指传统工业自动控制与信息系统中产生的数据,如CRM、ERP、MES等。机器设备数据是来源于工业生产线设备、机器、产品等方面的数据,多由传感器、设备仪器仪表进行采集产生。外部数据是指来源于工厂外部的数据,主要包括来自互联网的市场、环境、客户、政府、供应链等外部环境的信息和数据。

工业大数据的实践落地高度依赖行业经验与人工智能等数据科学的融合,通过将行业知识、经验固化到软件中,实现对工业场景中面临的不确定性实现更加有效地管理,形成数据驱动、快速迭代、持续优化的工业智能系统。

工业智能技术实现的关键步骤

在2015 年通用电气(General Electric)推出GE Digital 时,GE Digital 的CTO Harel Kodesh 就提出过:工业数据不准确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等导致了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。

天泽智云首席架构师朱武曾在InfoQ刊发过的《海阔凭鱼跃:记一场工业场景下的AI技术实践》一文采访中提到,工业数据的多源性、复杂性和动态性强,比如柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等原因,导致工业智能背后数据特征提取、建模等层面的技术挑战。因此,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,需要建模及训练在整体和个体、通用性和个性化之间取得均衡。

从工程实现的角度,工业智能实现的关键有如下几步:

1.    定义工业场景:正如上文所提及,问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性;

2.    数据的完备性和质量:工业现场数据一般带有很多噪声,而数据范围和质量决定了后续处理的难易程度和最终结果的准确性;

3.    智能应用支撑环境:工业智能应用本身就具备碎片化、个性化、专业化的特点,如何提供快速有效的应用实施环境,包括数据环境、模型研发实验环境、应用部署环境等,决定了工业智能应用的推广和客户接受速度。

依照美国NSF 智能维护系统中心创始主任李杰教授、天泽智云CTO 刘宗长共同发表的《工业大数据:挖掘“不可见世界”中的价值》一文中的阐述,CPS 是一个具有清晰架构和使用流程的技术体系,针对工业大数据的特点和分析要求所构拟的技术体系,其能够实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。因此可作为工业大数据分析中的智能化体系的核心。

CPS 的5C 架构

工业大数据正是以行业模型为前提,将面向不同行业、不同场景、不同学科中的工业机理、专家经验、行业知识和最佳实践固化成为数据统计、挖掘和分析模型,将业务问题转化为数据可解的问题;以数据科学为基础,使得深度学习、迁移学习、强化学习等为代表的人工智能算法成为解决工业大数据领域诊断、预测与优化问题的得力工具;以软件服务为目的,形成可落地执行的工业大数据解决方案。

竞赛是推动创新探索、实践指导与人才发展的有效途径。美国早在2008年起开始探索通过竞赛方式促进大数据、人工智能与制造业融合,针对设备健康状态评估、剩余生命周期预测等问题进行方法研究和测试论证,涉及航空发动机、齿轮箱、风机测风仪、半导体、轨道交通等多个工业场景。GE也曾经发起过多次数据竞赛,悬赏解决飞行路径规划、医疗大数据等问题,并获得解决实际问题的具体模型算法和专业人才。

他们如何看待智造时代下的大数据未来

为深度挖掘工业大数据的实际落地场景,探寻我国制造业转型升级的发展趋势,1月13日,我们专程前往由工业和信息化部指导,中国信息通信研究院联合工业互联网产业联盟、华为、富士康、积微物联共同主办“第二届工业大数据创新竞赛”的决赛答辩现场。

在共同见证优胜团队诞生的同时,InfoQ编辑在答辩现场也采访到了中国工程院院士 孙家广、中国信息通信研究院总工程师 余晓辉等重磅技术专家。那么,在新一轮的科技与产业变革中,他们是如何看待智造时代下的大数据未来呢?

相关阅读:

大数据如何改变消费者贷款的性质  

国内首个肿瘤AI大数据实验室秀“内功”  

为什么云计算突然变得如此复杂和昂贵

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>