当前,人工智能正以前所未有的速度引领科技浪潮。除了颠覆行业,已经有越来越多的产品结合人工智能,集成了机器学习、计算机视觉、自然语言、语音识别等前沿科技。科大讯飞作为首批国家四大人工智能创新平台之一,不断赋能行业同时逐步走向消费者。技术顶天,掌握源头核心技术并处于全球领先;应用落地,让技术转化为大众切实可感受的产品。这是讯飞的价值观坚守。如今,其AI核心技术开始深入各产业路径,向核心节点迈进。
科大讯飞准备如何跟消费者走得更近呢?11月15日,科技部公布了首批国家人工智能开放创新平台名单,科大讯飞与BAT一同成为AI四支“国家队”,再一次确认了其在语音人工智能平台上的霸主地位;11月22日早盘,科大讯飞市值突破千亿大关。这似乎达成了科大讯飞的小目标。
作为“BATI”一个层级的企业以及看涨的股价,都让讯飞从幕后走向了舆论的聚光灯下。不可避免的,科大讯飞受到舆论的关注和压力。在一些人看来,与高市值相比,科大讯飞强于技术、规模够大,但速度太慢。讯飞也注意到了这个问题,但讯飞的看法是,如果要做出改变,不是要离钱更近,而是要离消费者更近,要通过科技创新成为行业生态的核心节点。今年胡郁代表讯飞在外多次分享,除了介绍讯飞在人工智能上的思考以外,发言重点绕不开两个关键词——科技创新,消费者业务。
关于商业模式上的思考,胡郁在今年的一次公开演讲里说了这么一番话,很耐人寻味,他说,“一个公司能够赚到多少钱,跟你的努力程度有关系,但跟你公司在整个商业系统中的位置有绝对的关系。只有成为商业生态系统中的核心节点 (Keystone),整合各种资源并带动整个系统的发展,实现共赢,才能够成为真正伟大而有影响力的公司。”
在这一场呈现加速发展的人工智能浪潮中,聚焦点落在个体,关注到消费者,说明胡郁正在考虑如何优化讯飞的商业结构,特别是打通通向最终消费群体这条通路。而这条路,是一个科技创新型企业的必经之路。
看看几十年前的英特尔和微软,最初都只是围绕为IBM提供技术的幕后角色。但真正成就两家公司的,则是它们积极的推广普通消费者可以认知并感受到的业务后,也就是我们熟悉的intel inside和Win95。
这对今天的中国科技企业同样具有启发,在中国大市撤境里,想做一个永远在幕后、纯而又纯、美而又美的科技创新性企业(就像讯飞)实在是太难了。因为有时候你要开拓的市场里你就是绝对的前沿,只有你自己才能理解如何把科技创新变成商业价值。
再看看苹谷微,目前至少在中文语音的人工智能技术上,这三家都不如科大讯飞,这是业内公认的。但不同的是,它们业务都离消费者更近,也有强大的赚钱能力和品牌号召力。讯飞的强势在哪?行业应用上的不断拓展,在前沿探索方面屡获佳绩。我们今天在中国使用的几乎所有语音技术也基于讯飞的赋能,比如国家教育系统里的语音评测,几乎陪伴每个人的高德地图里明星语音导航也源于讯飞的语音合成技术。这就是讯飞的底气,但现在的讯飞显然意识到仅仅靠技术支持来开展业务还是不够的,它要离消费者更近,要自己或通过行业赋能,直接地为消费者输出价值。
众所周知,讯飞已经是语音识别和人工智能方面的老大,但要进军消费级市场就一定能成功?不妨看看刚刚成立一年的讯飞消费者事业群。
2016年底,讯飞面向消费者推出了讯飞晓译翻译机,讯飞万物互联输入法,讯飞家庭智能盒子超脑魔盒、讯飞飞鱼助理等一系列产品。到了2017年,消费者事业群进行了更深层次的商业逻辑梳理,用“四大场景”的说法,升级了以前的单品策略。
“未来是属于会主动思考从而更懂每个用户的终端产品”,胡郁最近在世界互联网大会上说到。而这一切需要基于一个核心的人机交互系统——AIUI。虽然还不是一个响当当的名字,但已经在基础语音语种识别基础上支持主动式对话、语种自适应、多模态交互、个性化识别等进阶能力,这些能力决定了当消费者与机器对话时,你的体验能够有多好,也将赋能翻译、移动、车载、家庭四大场景。
京东上,讯飞晓译翻译机产品的评价数已超过6300条,满意度98%,远超过其他产品。在今年11月刚推出了晓译翻译机1.0+的升级版。很多人都觉得奇怪,为什么用智能手机可以实现的功能,要单做一个产品。其实,这就是典型的消费电子的产品逻辑,在面对典型、刚性的需求上,只要用户体验够好,专用产品比通用产品能够更深地切入市场,也能更快地进行针对性的迭代。
与智能音箱类产品不同,翻译产品需要解决的是能否快速翻译?翻译效果是否准确?翻译后的语句朗读是否足够本地化?这更偏向于智能语音综合能力的集成创新,对源头语音的识别和理解,乃至合成语音的专业考验。而从2011年开始,第一个将神经网络技术应用于智能语音领域、积累智能语音的有效大数据的讯飞而言,显然是有备而来。除了做到利用源头创新技术实现多场景识别,1.0+的讯飞晓译翻译机实现了离线翻译、多语言、一键求助,满足用户在网络不佳、场景变化下的个性化需求。一键求助能够在3秒内和紧密联系人或讯飞客服中心相连接,从而获得帮助。
又比如移动场景,市面上几乎所有支持中文语音输入的输入法,后台上基本都是讯飞技术支持。目前讯飞输入法已经拥有5亿用户,1.2亿月活,98%通用场景准确率。但有一个问题,就是在中文语音输入肯定会面对“同音字”的问题,加上一些标点符号或特殊字词的问题,我们常常要手动去编辑语音输入的词句,大大降低了语音输入的效率。这也成了讯飞的产品经理聚焦用户体验后发现的又一个突破口。于是讯飞输入法诞生了一种叫语音智适应的黑科技,它基于用户对识别结果的修正,即时优化用户个性化语言模型,一次修改后,输入法就能记住你的输入习惯,进行自动矫正。
还有车载场景和家庭场景。目前几乎是所有推出了语音识别的智能互联车型中,都搭载了讯飞的飞鱼系统,装机量千万,在线用户量超300万,语音月活90%以上。有一位资深的汽车行业人士告诉笔者,目前很多国际品牌的汽车在中国推出搭载智能系统的车型时,几乎100%都要提到讯飞,因为它们在国际上找不到第二个供应商能提供这么完善的解决方案。特别值得一提的是,对于很多非飞鱼系统的汽车,讯飞还推出了一个叫小飞鱼的外设,可以轻松地赋能给原本不够智能的汽车。
而在智能家居场景中,讯飞推出了魔飞麦克风系统,该开发套件采用立体构型、分布式拾音,并提供极简开发以及更强的交互效果,还支持声纹识别、手势控制以及语音购物。当然,由于智能家居这个领域的玩家很多,解决方案和路径又天差地别,所以讯飞还没有做到一家独大,但就技术层面来看,讯飞提供的赋能方案是最接近于自然应用体验的。
从推出单品到场景化,我们看到的不仅是讯飞在消费者业务上逐渐有了一条清晰的思路,更重要的是,我们看到了技术的讯飞之中,崛起了一个产品的讯飞或者说是消费者的讯飞。
给整个讯飞消费者事业群提供有力支撑的,是讯飞在上下游的布局,尤其是以讯飞超脑诞生为时间标志的讯飞AI路线,其中的核心是从感知向认知的混合式跃进。那另一个问题是,技术和钱,对于讯飞究竟是什么样的关系?
胡郁对此的阐释是,“靠卖技术发展的科技创新型的公司,一开始离钱是非常远的,只有两种办法才能改变自己的命运。第一,是从一个技术公司慢慢变成产品公司,产品公司慢慢变成品牌公司;第二,是发明一种可以颠覆原来产业的技术,产生一个新的生态,但这是可遇而不可求的事。” 所以,上游技术、中游产品,下游赋能,再从中再造生态,是讯飞消费者业务的逻辑链路。
从上游来看,整个讯飞都在探索未来的AI发展路径。目前,正在从感知智能向认知智能飞跃的过程之中。而胡郁强调,语言是认知智能中最核心的东西,语音交互将继续是讯飞的切口,下一步的突破,就必须是感知智能和认知智能组合的突破。
去年,在美国的CHiME Challenge英文识别大赛上,讯飞在三个比赛中全部取得了第一名;在今年的国际语音合成大赛上,科大讯飞再次获得第一名;在TAC Knowledge Base Population知识推理大赛中,讯飞也取得了第一名的好成绩……诸多的第一已经足够证明讯飞的AI实力。
中游做产品。讯飞如果要做大消费者业务,并不能仅仅依靠事业群去直接驱动产品研发,即使有了一些突破,它的更大作用也不是现金收益,而是示范讯飞的技术应用和解决方案。真正要与讯飞强大、深厚的技术所匹配的消费级产品研发能力的培养,一定要建生态来解决。科大讯飞首届全球开发者节,科大讯飞总裁刘庆峰站上舞台,向台下集结的程序员致意;我们还看到,讯飞将投入10.24亿基金扶持平台上的开发者,支持1024个项目来开放式探索人工智能教育,发布涉及人工智能生态、教育、公益三方面的1024计划。据统计,目前AIUI平台上的开发者团队已经达到46万个,日均交互次数达到40亿,累计终端数达到12亿。也就是说,如果有一天我们真正看到讯飞能够在广泛的消费场景中被应用,一定不是它自己的产品实现了全局覆盖,一定是它和它的合作者和开发者团队一起发力的结果。于是我们就会看到,无数的创业者会争着和讯飞握手。对技术服务的增值充满信心,大概是为何讯飞对于百度宣告基础服务免费这样的文字游戏表示从容的原因。
从某种意义上来讲,讯飞未来消费者事业的发展需要摸索出一条全新的路径,不仅仅是越来越多的智能产品打上讯飞商标,而是每一种智能设备都必须打上讯飞 inside的LOGO才能获得消费者的认可的时候,才算是真正意义上的成功。
广州财富论坛后,刘庆峰在朋友圈说了一段意味深长的话,“人工智能+时代,不仅是属于科大讯飞的时代,更是属于人工智能领域万千开发者和科学家的新时代。这里空间广阔,完全容纳得下千帆竞发的产业生态。”