作为亚马逊旗下的云计算服务平台,AWS 如今已迈入第 11 个年头,成为年化收入 140 亿美元,却仍然保有 43% 年增长的庞然大物。
在亚马逊 AWS 全球副总裁、大中华区执行董事容永康看来,AWS 取得今天的成绩是一个水到渠成的过程。当其他企业还在讨论亚马逊提出的新概念的可行性时,公司就已积累了大量内部测试经验,当一项技术达到一定的成熟度,AWS 则顺理成章地将相关资源开放给客户。
从一个众人眼中的公有云平台,到被公认为企业转型与创新所需的技术平台,亚马逊的技术储备,就是 AWS 提供云服务的底气。与谷歌、微软以软件即服务(SaaS)起家,逐渐下移到平台即服务(PaaS)和基础设施即服务(IaaS)的路线不同,亚马逊一开始就提供基础设施,在此基础上,为满足不同开发者的需求,进一步提供平台与软件。如今,AWS 提供超过 90 个大类的服务,拥有数百万月活跃用户,涵盖了不同的企业类型与企业规模。
7 月 27 日,2017 AWS 技术峰会北京站在国家会议中心举行,会上,容永康与亚马逊首席技术执行官 Werner Vogels 对 AWS 的业务进行了梳理,众多 AWS 的客户和合作伙伴也分享了他们使用 AWS 云服务的经验。人工智能作为一个对云计算有巨大需求的领域,作为 AWS 眼中未来十年的大趋势之一和近期投入大量资源的方向,也引发了广泛的关注和讨论。AWS 为人工智能领域提供了哪些产品?其优势体现在哪些方面?机器之能在采访了相关负责人及行业用户之后结合演讲内容进行了以下梳理。
应用云计算的人工智能相关公司可以从「开发者」和「应用者」的角度简单分为两类。开发者以人工智能模型本身作为产品,以算法为核心建立新的行业秩序、划定新的分配原则,创造或颠覆一种商业模式。他们对云的需求是数据存储、计算能力基础设施以及机器学习框架平台。此类业务中最典型的莫过于自动驾驶。
应用者则利用人工智能的技术加强自己原有的产品与服务,这类企业的工程师未必有人工智能核心算法的开发能力,因此以 SaaS 的形式提供通用的,可以进行有针对性微调的人工智能接口更符合他们的需求。这类公司可以通过调用相应 API 与自身的产品或服务配合。智能家居、智能农业公司都是常见的应用者。
AWS 为两种类型的公司都提供了丰富的产品线。
致力于自动驾驶领域的图森未来是开发者中的 AWS「重度用户」,其 COO 郝佳男在媒体沟通会上提供了近十种图森未来使用 AWS 的典型场景。他表示,AWS 吸引他的地方在于,当他按照需求构建架构时,可以像拼图一样从 AWS 的产品列表中找到合适的产品。
Vogel 也在演讲中表示,规模庞大、来源复杂的数据是人工智能领域面对的首要挑战,首先要对数据进行管理和处理,然后是使用 GPU 进行训练,最后在边缘设备上运行模型做出预测。
对于图森来说,车就是「边缘设备」,而为了让车运行,主要的工作其实都在车外的云端完成。研发车背后的系统需要大规模的基础架构平台支持,这就是图森未来与 AWS 结合之处。
首先是数据,郝佳男介绍,需要解决的问题涉及数据的上传、存储、标注、抓取等多方面。用于数据收集的车辆上搭载大量传感器,每辆车每小时产生的原始数据就有 TB 级别。如何让不同来源的数据从车上流畅地流向云端并不是一件容易的事情。而数据上传之后,还需要上千人对数据进行标注,之后才能训练监督学习类型的人工智能算法。标注完成,在使用数据时,并非每次都抓取所有的数据,比如训练雨天的算法,就需要对雨天的数据进行查询和操作。
为了解决这些复杂的问题,图森未来使用了多种 AWS 产品,将数据从本地传到云端,稳定的链路需要 Direct Connet,传输大量数据需要 Snowball。数据和大部分产品在 S3 上,数据到达 S3 就会触发 Lambda 做预处理,Glacier 提供数据备份,RDS 提供元数据检索。
在架构和算法层面,以可扩展性闻名的 MXNet 是 AWS 的官方深度学习平台,使用者可以通过 MXNet 的 AMI 快速构建 MXNet 环境。一个典型的训练,可能需要 8 个 GPU 花费数小时才能完成,EC2 提供的弹性计算资源则从基础架构层面解决了资源调度的问题。
作为一家自动驾驶公司,郝佳男认为,他们应该把更多精力和成本投入在自动驾驶上,AWS 则以低运营成本、高可用性,满足了人工智能开发者在研发过程中对基础架构的需求,使他们的研发得以顺利进行,减少车辆在路测时的问题。
Vogel 展示了一张在 AWS 上运行的人工智能企业的列表,包括用机器学习算法评估房地产价值的 Zillow、依靠推荐系统起家的视频流网站 Netflix 以及 GPU 发明者英伟达等。Vogel 博士表示,服务这些人工智能最前沿公司的底气来源于亚马逊自己的机器学习经验,因为亚马逊电商网站的库存管理、搜索排序、对评论的整理、对新产品的预测都使用了机器学习和深度学习。
除了让人工智能开发者的注意力集中在自身算法的开发之外,AWS 提供了三种可以立刻应用的人工智能服务:对话服务 Lex、语音服务 Polly 以及视觉服务 Rekognition,使人工智能应用者节省了模型搭建的时间,从而将注意力集中在服务本身。
Lex 来源于亚马逊语音服务 Alexa 背后的技术,使用自动语音识别(ASR)技术将语音转为文本,然后用自然语言理解(NLU)技术理解文本的意图,能让开发者将对话接口用于任何使用语音或文本的应用中。作为 Lex 的客户之一,NASA 用 Lex 复制了一个火星探测车 Rov-E,使学生通过对话的形式学习火星相关知识。iRobot 则开发了能用语音控制的扫地机器人。
语音服务 Polly 利用深度学习技术将文本转换成类似人声的语音。华盛顿邮报作为 Polly 的客户,正在利用这一功能开发语音版报刊。
视觉服务 Rekognition 则帮助人们识别图形,提取其中的信息。比如判断图片中是否有人,通过面部检测、判断这个人是否佩戴眼镜、有什么样的表情,也可以找出做不同表情的同一个人。美国的有线电视网络 C-SPAN 在 Rekognition 发布两周之后,就通过对近十万条数据的学习建立了一个精确到秒的甄别器,用于快速识别视频内发表演说的政治家。
通过向应用者提供人工智能服务,AWS 提供了一个大公司将深度学习技术民主化的良好范例:所有开发者都能运用亚马逊级别的技术创建自己的应用,这些应用可以服务于任何有需要的群体。而这些用户和合作伙伴又进一步构成了一个活跃的生态系统,正如 AWS 首席云计算企业顾问张侠所言,「当你有特定需求的时候,在我们的生态系统里能找到一批可以直接借鉴的成功案例。」