近日,科大讯飞执行总裁、消费者BG总裁胡郁在年度发布会上全球首发“语音智适应”,目前讯飞输入法Android和iOS新版已加入该功能,宣告输入法真正进入AI时代。与此同时,胡郁宣布讯飞输入法活跃用户数突破1.2亿,用户量保持高速增长的势头,这对整个输入法行业的发展都带来积极的作用。尤其是,持续的源头创新令讯飞输入法语音输入第一品牌的市场地位始终稳固。
纵观2017“亿员俱乐部”上榜名单,活跃用户过亿的成员包括微信、手机QQ、手机淘宝、新浪微博、UC浏览器等知名产品。相对其他APP,讯飞输入法是一款自带工具属性的移动产品,并不像搜索、社交、购物等天然的“流量大户”能够吸引不同属性的人群。作为科大讯飞C端AI阵营的明星产品,凭借出众的功能和出色的用户体验跻身其中,实属不易。
在讯飞输入法看来,人工智能是驱动产品变革和体验提升的关键所在,用人工智能赋能产品,打造以智能语音为轴心的新生态是行业发展的必然趋势。此次推出的“语音智适应”,基于Cache based Fast Adaptation技术,即时优化用户个性化语言模型,再次输入就能精准识别,解决反复修改的痛点,真正做到“知你所想,懂你所说”。
过去3年时间,讯飞输入法通过用户调研和大数据洞察,现阶段有20%的人存在语音使用问题,导致识别率偏低。一个是发音习惯,口音现象降低了通用场景的识别效果;另一个词语方面,比如姓名、宠物名或医生、律师、金融从业者、学术研究人员所用的行业词影响识别率。想要解决这些问题,目前最好的方案就是语音个性化。通过整合深度神经网络DFCNN、长短期记忆网络RNN,构建了个性化的声学模型和语言模型,助力于人工智能应用落地。
当前讯飞输入法已经拥有巨大的用户规模,如果给每一个人都提供个性化的语音输入服务,势必导致巨大的计算压力。为解决这一难题,讯飞输入法采用了残差自适应算法优化,将每个人资源利用率提高100倍;采用热匹配工程优化,把服务吞吐量提高50%;采用分时复用架构优化,把响应效率提高100%,从算法、工程和架构三个方面的技术落地,最终实现为海量C端用户提供即时的个性化语音服务。
“最美不过乡音”,对国人而言,手机能“听懂”方言是一大福音。目前,讯飞输入法独家支持22种方言语音输入。随着人工智能技术日臻完善,讯飞输入法运用语音识别、语音转写等前沿技术使方言与文字更好的结合起来,对外发起“方言保护计划”,全民共建“中国方言库”。上线不到一个月时间,便吸引数百万人一起传承弘扬中华传统文化。
在服务国人的同时,讯飞输入法还积极地把产品推向海外,让海外用户同样享受讯飞语音的便捷。为此,讯飞输入法部署上线了海外服务器,有效避免网络影响语音输入的不利因素,大幅提升海外用户使用语音的响应时间;同时,对海外链路精选优化,进一步保障语音输入的准确率与成功率。得益于此,美国、英国、意大利、日本、韩国、印度、马来西亚、新加坡、泰国、澳大利亚等国用户使用语音的稳定性和安全性有了质的飞跃。
作为语音输入先行者,讯飞输入法深耕人工智能领域已久,率先把尖端技术应用于产品。借助AI+输入法的优势,支持超长语音输入和耳语输入;利用机器学习特性,提高噪声环境语音输入的普适性和实用性;在全球一体化大趋势下,升级随声译实时语音翻译功能,支持中英文语音实时翻译,还实现说中文翻译日文和韩文;此外,新加入语音斗图,想要什么表情就直接说出来。多年来的坚守让讯飞输入法对整个行业的理解更加透彻,用户需求更加明晰。在AI的赋能下,讯飞输入法语音输入第一品牌效应在不断凸显和升华。