全球AI先锋共筑联邦学习开放数据生态_大数据资讯

2019年8月29日至8月31日,2019世界人工智能大会(WAIC)于上海世博中心拉开帷幕。作为世界顶尖的人工智能合作交流平台,本次WAIC大会以“智联世界无限可能”为主题,围绕人工智能领域的技术前沿、产业趋势及热点话题展开讨论。大会聚集全球人工智能领域具影响力的科学家、企业家与相关政府领导人,吸引超过50位学术界领军人物与超过100位产业界领袖一同参会。

其中,微众银行深度参与了WAIC大会的多个议程,微众银行首席人工智能官杨强教授分别在8月29日的主论坛-科学前沿、8月30日的国际前沿算法分论坛中发表了《人工智能的最后一公里——联邦学习的最新应用》、《人工智能的“先行区”》两场演讲,针对当下人工智能落地面临的多个挑战,提出联邦学习全新解决思路,并分享了人工智能领域的最新算法研究。在大会的黑客马拉松环节,微众银行主办“智能垃圾分类挑战赛”,发展在垃圾图片上的人工智能识别技术,助力AI技术应用落地环保领域。

以联邦学习技术应对 AI落地的双重挑战

随着人工智能技术的深入发展及落地,其潜在的许多问题也日益明显。在WAIC大会主论坛的演讲中,杨强教授提出了当前人工智能发展面临的双重挑战——“数据孤岛”与数据安全问题。在我们的认知中,“人工智能”常常与“大数据”相提并论,然而现实情况却是数据多以孤岛的形式存在。在法律、金融、医疗等多数行业拥有的是小数据与零散的数据,即使是同一个企业的多个部门,彼此的数据也无法互通。另外,《通用数据保护条例》(GDPR)等法规的实施,对数据隐私的保护愈发严格,极度依赖数据的机器学习面临着前所未有的困境。

面对以上两大挑战,杨强教授分享了“联邦学习”这一全新的概念。作为一种新兴的人工智能技术,“联邦学习”由微众银行AI团队在国内首次引进,能在不共享“数据”的前提下,共享“知识”,用协作实现联合模型的性能提升,以此保障数据在模型构建过程中的安全性,从而盘活“数据孤岛”并解决数据隐私问题。针对实际应用中的不同场景,微众银行AI团队提出“横向联邦学习”、“纵向联邦学习”、“联邦迁移学习”多个种类,其中“联邦迁移学习”将“迁移学习”与“联邦学习”融合,让跨机构合作突破了行业、数据类型等多重限制。在演讲中,杨强教授详细讲解了不同类型的联邦学习技术适用的不同建模情境。

探索协同建模新规范,共建联邦学习合作生态

在完善“联邦学习”理论的基础之上,更要建立起企业间协同建模的规范。在WAIC大会主论坛演讲中,杨强教授重点强调了这一问题。他认为,目前要通过建设激励机制、建立共同标准等方式,推动行业中的数据所有者共同参与联邦学习生态共建,让所有参与方受益于合规的联合建模链条,在遵循数据保护法规的同时享受数据福利,推动联邦学习的进一步落地。

此前,微众银行AI团队在推动建立联邦学习合作生态,应对AI在金融等领域的落地难题方面已经有所建树。微众银行AI团队构建了FedAI联邦学习合作生态,自主研发并开源全球首个工业级联邦学习框架——FATE(Federated AI Technology Enabler)使大部分传统算法可以经过改造适配到联邦学习框架中,从而快速加入联邦学习生态。

在提供技术保障的同时,微众银行AI团队还致力于建立起联邦学习在企业之间的对话语言。去年12月,由微众银行发起的国际上首个针对人工智能协同技术框架订立标准的项目——IEEE联邦学习标准项目获批,直至今年8月,已经成功召开了三次会议,有效推进了联邦学习国际标准草案的制定。杨强教授在会上提到,联邦学习标准的制定,将更进一步为联邦学习在各行业的落地应用提供规范,为社会各界合作奠定基础,从而吸引各行各业参与到联邦学习未来的学术研究与落地应用中来。

聚焦AI技术三要素,推动人工智能产业化

在本届WAIC大会的的国际前沿算法分论坛中,杨强教授提出,推动AI技术广泛落地并实现人工智能产业化的关键在于解决AI技术三要素——算法、数据、算力面临的困境。会上,杨强教授分别针对这三大困境——“如何实现AI算法设计的自动化”、“如何应对AI数据缺失问题”、“AI算力架构怎么设计”进行了讲解。

首先,机器学习规模化落地的关键在于自动机器学习(AutoML),即实现AI算法设计的自动化,形成闭环的自动学习机制,减少人的参与。杨强教授详细阐释了自动机器学习的三大求解要素——配置空间、配置性能评估、配置优化策略。如今,隐私保护问题越来越受到重视,在保护隐私的要求之下,机器学习算法效果严重下降,不同机构之间的数据也无法直接共享。面对这两大问题,杨强教授特别提出了解决方案——自动隐私保护迁移学习(AutoPTL),这一算法基于特征切分和集成学习提升学习效果,可以满足差分隐私保障,并支持数据迁移学习和自动化参数调整,有效提高AI的应用率和价值。

其次,在实现人工智能产业化的过程中会应对数据不足的难题,而“迁移学习”能够有效解决这一困境。迁移学习通过寻找数据与模型之间的关系,将大数据的能力迁移到小数据上,实现“举一反三”。杨强教授列举了迁移学习在大额消费金融领域的应用实例:在微信营销购车分期业务中,迁移学习基于全渠道营销数据帮助汽车分期贷款模型学习,挖掘近期有购车意向的客户,最终成功率与SAS模型相比提升了200%。

最后,实现人工智能产业化需要解决的第三个问题,是亟待提升的算力性能。当前日益增长的数据规模对算力性能提出了巨大挑战,传统的单点计算能力的突破已经不能满足需求,对此,杨强教授介绍了两种新型高性能算力架构设计——GDR高性能网络IO技术与新型分布式机器学习网络通信协议MLT。测试结果表明,新型高性能算力架构设计在 AI训练时性能提升明显,在采用 PS(参数服务器模式)模式上性能提升高达 76%,在采用 Ring (环模式)模式上性能提升高达 3倍。杨强教授表示,提升算力性能在拓展AI整体算力上起到越来越重要的作用,在GDR与MLT之外,更多相关研究也正在往前推进,值得关注。

赋能智慧生活微众银行助力AI技术应用落地环保领域

除了杨强教授在大会上的最新前沿观点分享,此次微众银行还在大会的黑客马拉松环节举办了“智能垃圾分类挑战赛”,围绕当下垃圾分类的社会热点,聚焦基于深度学习技术的图像分类模型构建,实现垃圾图片类别的精准识别,从而提高垃圾分拣效率。此次比赛获得了上海市绿容局的支持,上海市绿化和市容管理局科信处处长钱杰担任大赛评审,上海市绿化和市容管理局副巡视员缪钧与微众银行AI部门副总经理徐倩作为颁奖嘉宾共同为前三名队伍颁奖。

在本次WAIC大会上,微众银行AI团队围绕人工智能领域的技术前沿、产业趋势和热点问题分享了最新研究,联邦学习与新型算法等人工智能新技术正在日趋成熟,发挥着各自的优势,共同为AI技术广泛落地并实现人工智能产业化奠定重要基础。杨强教授在会上提到:“如今联邦学习已经成为AI在学术界和工业界的新趋势。”在这样的趋势下,微众银行将通过不断提升与开放自身的AI能力,将联邦学习等AI技术推广至多个领域的业务应用中,以AI为驱动力推动多个行业共同发展。

相关阅读：

晋城市大数据应用取得重要进展

张述元：做强司法大数据推进智慧法院建设