自主、开源、开放是深度学习领域被提及的高频词汇,这也透露出拥有自己的深度学习开源框架对中国AI发展极为重要。近日,百度开源深度学习平台飞桨曝光PaddleCV全景图,视觉技术能力三方面重磅更引起开发者的广泛关注。百度飞桨经过多年的开源开放积累,已在国内深度学习领域全面领先。旷视天元深度学习框架也紧跟飞桨脚步,首度开源。不难看出,国内深度学习市场热度高涨,业内人士深知只有原创才能引领,开放才能繁荣。
深度学习框架的火热始于2010年前后,基本上与人工智能行业爆发的节奏吻合。百度CTO王海峰曾说,在智能时代,深度学习框架向下对接芯片指令集,向上承接各种业务模型、行业应用,起到承上启下的作用,是“智能时代的操作系统”。
由于深度学习框架开源的属性,产品好不好用,开发者一看代码便知。而经过多年的发展,开发者对于深度学习框架产品的要求越来越苛刻:用户希望框架更易用上手,如友好易用的编程接口,清晰完善的培训教程,更丰富的功能,如覆盖视觉、语音、自然语言处理等多个领域,更好的性能,如大规模分布式技术,更全面的部署方案,如支持全硬件平台,更领先的技术,如强化学习、联邦学习等,这些对于框架产品都不是一蹴而就,需要长时间的积累与持续打磨。
而除了产品本身以外,对于深度学习框架的产品研发团队,如何持续把握技术热点并转化成领先、易用的产品持续服务用户,如何能找到切实有效的路径长期稳定积累开发者,如何以合作务实的角度发展上下游生态合作伙伴,这些也都是非常难的挑战。而能够坚持这么做下来的公司和团队,在全球范围内,真的并不多。
无论是上述对于AI综合技术实力的要求,亦或是对于开发资源需要常年持续投入,这些对于一般创企而言都是巨大挑战。此外,深度学习框架的持续迭代,需要高度丰富的内外部业务场景需求进行持续的全AI场景打磨,这点对于只有单一场景的创企也是困难重重。实际从现状来看,目前全球也仅谷歌、Facebook和百度等几大AI巨头在该方向上持续投入。
因此,一款深度学习框架产品要被广大开发者认可,只有在全面技术竞争力的基础上,长期持续紧贴用户需求打磨,围绕框架建立上下游生态,进而建立具备高度壁垒的综合竞争力。而这,是一条没有捷径的道路。
当前疫情防控和经济恢复的大背景下,各行各业正在广泛应用AI进行产业智能化升级。而开源开放的深度学习框架能够有效降低深度学习技术应用门槛,开发者和企业可以避免重复造轮子,更快速、便捷地开发AI应用,推动产业智能化进程。
在深度学习开源路上,·百度飞桨始终保持着高频升级迭代。目前飞桨具有开发便捷的核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和产业级开源模型库等领先技术,媲美海外主流框架,并在多项技术上有着更优表现。
例如3月23日飞桨重磅升级的PaddleCV新增了聚焦视觉能力的15种算法和35个预训练模型并全新支持3D图像任务,目前PaddleCV库中高质量算法已达到73个,预训练模型达203个。除了视觉领域外,飞桨还拥有包含NLP、语音、推荐在内的庞大官方模型库,相比 TensorFlow或PyTorch其数量、质量都是最优的。
核心技术的优势及不断贴合开发者真实需求的高频迭代,也映射在开发者的选择中。 此前IDC发布的《中国深度学习平台市场份额调研》显示,深度学习市场形成谷歌、Facebook、百度三强态势,三者占据了国内超过一半的市场份额。目前,飞桨已累计服务超过150万开发者,在工业、农业、服务业等很多关乎国计民生的领域,都有飞桨在发挥作用。
这样经过时间累积和沉淀的庞大开源社区,为自下而上的创新涌现提供了土壤。如新冠疫情期间,就有大量人工智能应用高效产出并在各个防疫领域发挥着重要作用。2月13日,飞桨开源了业内首个口罩人脸检测及分类模型,随后,包括中石油、北京地铁在内的百余家试用企业纷纷应用落地,覆盖全产品形态的口罩检测相关 AI 能力已在百度大脑全面开放。
在诊疗一线,位于北京的肿瘤数据平台和医疗数据分析企业连心医疗,基于飞桨开源深度学习平台开发了中国首个用于肺炎CT影像分析的开源人工智能模型。基于该模型的肺炎评估筛查系统已首先在湘南学院附属医院投入使用,并陆续落地多家医院。
在疫情防控和复工复产中,人工智能已经显现出服务社会、经济的重要价值。在国内疫情趋于稳定经济复苏的当下,企业广泛接入AI服务成为浪潮。以飞桨为代表的开源深度学习平台,已经成为智能时代的重要基础设施,正在帮助国家社会发展实现经济效益和社会效益的同步提升。
珠玉在前,后继兴起。人工智能领域“新基建”愈加坚实,AI已然迈入工业大生产时代。人工智能推动产业智能化、改变生产方式、变革包括教育、交通、医疗等各个行业的时刻,正在发生。