杜兰:尊敬的各位专家,雪球的伙伴们,所有在座聪明的投资者们,大家上午好! 我今天站在这里,有一点恍惚,因为我感觉很像11月9号我们科大讯飞年度发布会,当时在场有5000多人,在线800多万人看,今天雪球的伙伴们也特别热情,为了表达我重视的心情,我今天穿了件特别鲜艳的衣服,因为雪球的伙伴们最喜欢的颜色是红色。
科大讯飞高级副总裁杜兰
我们在11月9号开发布会的时候,特朗普总统来到中国,也是他第一次访华,我们也表达了对他的欢迎,这是用我们的语音合成技术,来展示了这样一段视频。而且大家也看到,他已经欢迎了雪球上的酗伴们。这个语音合成技术让机器像人一样能听会说、能理解会思考,这个历程已经经历了60年。这么多年语音合成技术也经历了跌落起伏的过程,今天我们看到的语音合成技术可以像人一样说话,而且它可以模仿你的声音去说话。
在座各位应该有用过高德导航,上面听过志玲姐姐甜美的声音,那也是科大讯飞做的,当时我们做的时候采集了十个小时以上的志玲姐姐的声音,后台通过人工标注,花了两到三个月时间才产生那个效果。但是今天我们合成特朗普总统讲话声音的时候,我们用了一个叫无监督任务学习技术手段,采用十分钟有效时间可以合成你想听到的声音,还会合成他不会说的中文的声音,这就是我们科技的一个进步。
金融领域大家都特别关注,其实也是把科大讯飞这个优点是低调,缺点是过于低调的公司,摆在公众面前。我们也知道现在科技的进步让各行各业发生很多变化。
今年或者去年去过纽约证券所的朋友都会发现,华尔街交易大厅过去熙熙攘攘的人群已经变得空荡荡了。我们也看到美国的顶级量化对冲基金已经开始用人工智能的技术、机器学习的技术,对我们进行一个策略的建模,而且使得交易算法成为华尔街的标配,甚至成为一些秘密武器。我们看到AI技术已经给金融领域带来了很大的冲击。
在这样的历程中,今年我们也看到纽约客最新一期的封面,那个封面让人特别触目惊心。街上熙熙攘攘的人群中,机器人在走来走去,我们人类坐在那儿乞讨。BBC也发布了未来人工智能对各个行业的替代,很多重复的技术的替代率高达98%以上,像电话推销员和速记员等等。有一些创造性的、个性化的、创意设计的工作岗位,比如说艺术家、教师,他们的被替代率是很低的。
这样的过程中我们会面临什么呢?我们先看几则新闻,我们可以看到今年6月份,我认为这是一个挺大的标志性事件,在著名的MIT,每一年都会发布全球十大颠覆性技术的榜单,2017年科大讯飞有两项技术是获得了关注的,一个是Reinforcement Learning,还有一个是Paying with Your Face,那么在这个MIT的全球50 Smartest Companies的评选中,我们看到中国已经有9家企业上榜,大陆7家,台湾2家,经历的过程是非常不容易的。因为大家看到人工智能三次跌宕起伏的过程中,第一次是1970年,第一代神经网络算法的出现,使得我们数学原理中前52项中的38项可以被证明。因为在这个过程中,因为我们的核心算法有缺陷,导致了失败。第二次浪潮是1982年,随着霍普菲尔德神经网络和BP算法的出现,使得出现了一次更高的浪潮,但是后来由于这些算法计算机的运算能力的限制和算法的难以收敛导致了2000年第二次AI冬天的到来。那第三次是什么时间呢?是2006年,随着我们的神经网络的出现,像我们的DNN、CNN、RNN出现以后,使得人工智能第三次浪潮又开始抬头。
在这个过程中,我们发现了一个重要的现象,这次浪潮中,中国并没有缺席,而且不断的在积蓄能量继续发展。我们可以看到,在这一次的评选中,中国企业已经在里面开始出现,值得欣慰的是,科大讯飞被评为世界第六、中国第一这样一个很好的成绩,我们相信人工智能不仅仅得到了技术界的认可,而且资本市场的朋友们和应用界的朋友们已经对我们给予了更多的关注,这也是大家对我们的一个鼓励。
我们再看到11月15号,科技部召开了新一代人工智能发展规划暨重大科技项目启动会,上面公布了一个最新的人工智能的四大平台。因为昨天我们在深圳进行一些业务的交流,很多深圳的朋友们和企业家代表都看到这则新闻,都很关注的问我们,我们认为讯飞和大家有一个不同的领域,从百度做自动驾驶,阿里云做城市大脑,腾讯做医疗影象,科大讯飞一直向人工智能语音这个方向发展,作为国家队四大阵营的出现,我们希望用自己的力量为新一代人工智能的发展贡献更多的价值。
我们也看到现在人工智能的发展究竟到什么阶段。又有一则新闻,让大家觉得非常的震惊。实际上,今年8月份,科大讯飞做了医考机器人参加了全国医学资格考试,这个考试每年都在进行,满分是600分,及格分360分,我们机器人考了多少分呢?456分。这意味着什么?医学专业资格学习的人,工作了几年以后参加这个考试通过率只有一半,我们这456分已经处于考生中的中高水平,大概在前4%和5%的水平,所以已经超过了绝大多数的考生,这也意味着全球首个通过国家临床职业医师综合比试测试的机器人诞生了。国家卫计委提出,2020年希望每个家庭都有家庭医生为大家服务,在中国这个人口非常众多的国家怎么实现呢?很重要的一点就是机器人医生,能给医生赋能,能给每个家庭提供更多的帮助。
所以大家看到,人工智能真的已经到来了。我们认为这一场全球竞争中什么是最关键的?源头技术的创新是最关键的,谁掌握了这个源头技术,谁就在这一场价值链的竞争中处于上游位置,谁就可以掌握未来。
我们也可以看到,在刚刚这几则新闻中,越来越多的现实问题给我们带来了很多警惕。像著名的《科学》杂志曾经提到,到2045年,也就是意味着到现在不到三十年的时间,人类的工作其中有50%会被机器所取代。这个数字在中国是77%,意味着有3/4的工作可以被机器所取代。11月份麦肯锡刚刚发布预测,2030年会有20%的工作被机器所取代。机器可以代替人。哪些工作是机器不能取代的?我们认为第一是手工,第二是情感,第三是创作。大家就业选择工作的时候可以多往这方面去引导。
未来,AI会让发达国家的GDP增速以及总量发生一些大的变化。我们可以看到,它比我们想象中到来的更快。
我们看这张图,Gartner公布的十大战略科技发展趋势,每年都会公布,去年我们关注到前三项是和智能有关,2018年依然如此,像前三项,人工智能基储智能应用与分析、智能硬件,特别是智能硬件今年很多,因为我在香港,在很多地方参与过一些这样的讨论,大家都非常关注智能硬件的发展,尤其是声控对大家未来的一些生态体系的变化,实际上看到人工智能给我们很多领域带来很多变化。
人工智能在业界研究的领域是从哪些方向进行演进的?目前是两个方向:
第一,以深度神经网络为代表的算法的进步,这样的算法使得我们很多方面能获得突破。为此,科大讯飞建立了语音及语言信息处理国家工程实验室,这样的实验室会带领我们在这个领域上不断突破。
第二,脑科学方向,脑科学和类脑科学的发展,给我们带来像仿声学等等的一些变化,所以我们也共建了类脑智能技术及应用国家工程实验室。关注过我们今年年度发布会的朋友会看到,今年的年度发布会上,讯飞不仅是说到做到,而是想到做到,我们的一个脑科学的实验,给大家看到了在脑科学这个方向上更多的无限的可能。
那么人工智能,业界对它的说法很多,很多人认为呢,觉得到底它是一场泡沫,还是无所不能的会给大家带来很多威胁?如果我们关注到技术的进展,以及了解到技术的这个边界到底发生在哪些范围内,我们就可以对这个问题产生一个非常好的答案,可以做到心里有数。
我们看看我们怎么把人工智能划分为三个阶段:第一个阶段,运算智能,也叫计算智能,这个阶段指的机器能存会算的能力。在这个阶段,相信大家已经很熟悉了,因为现在号称是人工智能的公司特别多,因为是模仿人的一些能力,甚至做计算器的公司也可以说自己是人工智能公司,很多时候运算和存储能力上,机器远远做得比人要强。
第二个阶段,就是我们所说的,能听会说、能看会认的能力,这是感知智能,在感知智能领域,部分机器做得比人要强了。第三个阶段,我们认为是最有挑战的,就是认知智能的领域,实际上这就是机器能理解和会思考的能力。
我们看一下,在运算智能AlphaGo出现之前大家众说纷纭,随后AlphaGo Zero出现了,人工智能战胜人类,是一件毫无悬念的事情,我们也看到越来越多的一些技术,给我们带来了变化。
像感知智能是能听会说,大家看到特朗普这个是说的能力,在座的各位,应该有用过我们的讯飞输入法,用过讯飞输入法的请举手(举手),非常多,我们已经有5亿用户了,我们的准确率已经达到了98%,那么这个意味着什么?我知道我们之前像用了讯飞听见会议系统的时候,看到我们这个转写的效率,我知道我自己的说话,因为我们正常的准确率是95%,我们在年度发布会上曾经抽取过和最高的速记员进行过比对的,我这样的准确率大概达到了99%点多的水平,人类最高的速记水准只有达到80%,所以在这一点上,我们的听和说的能力都已经超过了普通人类的能力。我们也看到特别像是无人驾驶等等大家关心的领域,前不久的奔驰举行的比赛,叫Cityscapes。它是通过自动驾驶过程中的图像识别的技术,可以判断前面是人、树、马路崖还是车,我们有44个企业参加了这样的比赛,科大讯飞拿了全球第一,实际上这就帮助我们在未来可以带来无限多的想象空间。
不仅仅在这些识别,包括在翻译领域,我们现在说中文的时候,已经可以同步翻译成像英文、法文、日文、韩文、维吾尔语等等,非常多已经在现实中应用了,我们最早用的是在今年3月28号在广州的国际投资年会上。我们图像识别中间,包括医疗影像识别有一个LUNA测试,不断的打破我们创造的纪录。现在TB这样的病例,肺结核这样的病例,我们的机器诊断率达到了94.1%的水平,几乎接近一线医生的能力,而全国平均水平大概在70%左右。
所以我们看到在运算智能和感知智能的领域,机器已经给了我们很多的惊喜,那么在认知智能领域是怎样的呢?认知智能是对人类来说目前最大的挑战,业界替代图灵测试的一个比赛Winograd Schema Challenge,它提了一些我们人类看到是非常简单的问题,其实机器是非常难回答的,我们虽然拿了全球第一,但是准确率只有58%,所以还有很长的一段路要走。最近斯坦福举行的一个SQuAD阅读理解的大赛,我们在十万篇英文的文章中,由人提出问题,由机器通过文章来进行解答,当时的Google、Facebook、IBM和微软都参加了,我们拿了全球第一,这给了我们在认知智能上的鼓励,我们在这个领域让机器不断做到能理解和会思考。
我们看到,全球人工智能产业进入了关键窗口期。我们也认为,今年很多时候看到国家把它上升为一个重要的战略,3月份首次进入两会的报告,到7月份国务院印发新一代人工智能的发展规划,也看到,在这个过程中,中国正在用举国之力抢占人工智能的制高点,在这个领域中,我们认为中国非常有机会,因为中国在客户中心型和效率提升型上的创造力更强,我们也认为人工智能的这场竞争中,认知智能领域中国和美国都进入无人区。
我前两周从新西兰回来,我也是参加了作为中国青年企业代表,和新西兰作了一次交流,我们也谈怎么在“一带一路”战略下怎么用人工智能赋能,我们也看到全球各国也都非常重视人工智能在参与到青年的创新创业和新的发展机会中来。 这个过程中,我们也希望大家看一看讯飞公司核心能力的发展,公司总部有一块大石头,上面写着四个大字“顶天立地”,意味着技术要顶天,应用要落地。比如说技术要顶天,有哪些技术?像语音合成,实际上从2006年开始就已经参加暴风雪竞赛,到2017年,我们已经连续12年拿了第一名,还有我们的语音识别、口语评测、机器翻译、阅读理解等等非常多领域,我们都已经代表了全球领先的水平。仅仅是技术领先,我们认为还不够,我们未来面临这个产业发展的机遇,更多是要把应用立地,能够和各行各业加在一起,能够产生更大的价值。比如说AI,可以加个人,AI可以加每个行业。我们可以看到AI未来给大家带来的最大的变化是什么?
我认为是两方面:一方面,人和机器互动的方式会带来很大的改变。当你处于一个远场移动和没有屏幕的时候,人和机器交互的方式是什么?我相信像人类一样,用语音进行非常自然的交互,这会给我们生活带来很大的变化。第二个变化呢,是我们机器的学习能力,比如说AI可以学习最优秀的专家的能力,它可以超过我们90%的普通人,所以AI是供给侧的创新引擎,可以给我们个人和各个行业都带来更多的发展价值,它可以为世界赋能。
所以我们看到,在整个讯飞的产业链上,我们可以进行很多的创新和我们的一些战略。我们的战略实际上就是平台+赛道。平台方面,相信很多创业者坐在这里,我们2010年将讯飞的语音云平台开放给大家,在此基础上,每个人用我们的语音能力和人工智能的能力进行各种技术开发,这也使得我们在整个产业生态链上处于比较好的位置,而且我们也形成了非常好的人工智能开放的生态体系。在此基础上,我们会选择重要的领域成为我们的赛道,比如说我们的教育、智慧城市、医疗、公检法的领域、智能客服等等,这样的一些重点赛道,就会成为我们发展的一个重心,我们会以此来做更多应用的创新。
所以,我们也认为,当前怎么样把应用做到更好,而且我们也认为第三次浪潮中,中国和各个城市,特别是像深圳这样一个有发展机遇、充满升级活力的城市应该怎么发展?我们认为围绕三个要素:第一个要素,核心算法,它的突破是给大家带来更多的源头技术的创新。第二,行业数据,中国移动互联网的发展带来特别丰富的数据。还有我们一线的城市,有特别多的行业专家,行业专家结合我们的行业大数据,进行定标让机器学习,就有无限种的人工智能应用产生,会给我们带来非常多的变化,我们就围绕这样的体系产生了非常多的产业生态。像刚才提到的AI+individual,像讯飞输入法和明星产品翻译机,相信大家都看过,用过我们翻译机,我们刚刚送了一台翻译机给奥巴马,前两天澳洲的一位州长来我们这里,她到我办公室坐的时候,我也把一台翻译机送给她,她也很高兴,中国的技术发展给他们很多惊喜。我们也看到AI+industry,包括我们中间重点的赛道就是教育,目前我们已经服务了8000多万师生,有12000多所学校,特别是全国百强校中间有68所都用了我们技术,真得使得大数据在后台为每个学生提供个性化的算法的一些服务,提高老师的效率,我们想让因材施教的梦想离我们越来越近,我们想让人工智能助力我们的教育,达到更好的效果。
像我们的AI+城市,我们在后台把几千个数据打通,让数据在后台替老百姓跑腿,越来越多的这种效率的提高,在二十多个城市已经看得到。我们希望AI+城市的应用,带给我们更多便民的措施。
像AI+医疗,不仅仅是我们大家可以想象到的,在一线去做一个语音电子病历,医生很忙,两只手都在服务在给你检查口腔的时候,他带上我们的麦克风,通过语音可以把病历写出来。同时我们的综合问诊平台,在后台为医生服务,为医生提供一个更准确的判断,所以这样子的一个技术,可以在很大程度上给我们提供各种各样的赋能型的技术。
还有AI+司法,我们的机器可以将大数据、人工智能和司法相结合,那么多辅助的量刑和大量问卷的学习,机器都可以进行一些判断。前段时间有很多这样的案例,它出现的时候,我们直接导入进来,可以看到里面有自相矛盾的地方,这个过程中,我们前段时间和检察院沟通,他们认为老百姓更能接受,老百姓已经知道这个过程中它可以给我们带来客观和公正的价值判断。
谈到AI+金融,一方面是我们的服务更加智能化、运营更加智慧化,相信很多公司已经在做这样的AI放贷官、智能投顾、量化对冲算法上在进行一些同步的做法,我相信AI+金融会带给我们更多惊喜。 前段时间美国做了一个AI软件,将人类36万个小时做的工作,通过机器几秒钟就达到了,这样不仅精准,更重要的是,机器不需要休息,所以可以给我们带来很多价值。
包括AI+客服,通过客服领域,目前30%的工作是由机器在接电话了,可能你下次给海底捞打电话,对方接待你的可能就是我们的机器人了。
AI+车载,车载是非常好的娱乐办公的平台,我们在中文车载语音市场上占据了90%的份额,其中,不仅仅是宝马和奔驰等知名厂家都选择和我们合作,为什么?因为当汽车行使到100公里以上,而且是有空调的非常大噪声的环境下,很难有技术使得人和机器能够自动的对话,而科大讯飞做到了这一点,我们是唯一一个90%以上准确率的厂商。
AI+时代,我们认为不仅仅是从业者的时代,更是每个人的新时代,我们在AI平台上看到我们的数据每天都在增长。在最新的数据上,每一天使用我们语音技术进行交互的人次,现在已经超过40亿人次,这样一个数据,是跨终端、跨场景的,超过百度日PV。我们的一个终端数,已经累积达到15亿个终端覆盖,其中更值得一提的是创业者、开发者团队,图片上写46.5万,我昨天刚刚查过最新的数字是48万,这样的创业团队给我们带来非常多的产业生态。我们也看到很多科学家通过算法,可以聚集在我们平台上,用我们平台上的数据为他们进行一些验证,所以我们AI+平台的应用,不仅仅是赋能开发者的,而且也希望能够成就科学家。
最后给大家展示我们的产业应用生态图,非常希望不仅仅是主导方向,还希望是我们合作一起拓展的方向,还是广大开发者、在座所有最聪明的投资者一起,可以用我们人工智能的产业生态。
在今天我们想说,当我们谈到人类和人工智能的应用的时候,我们可以看到,我们认为比人类更强大的不是人工智能,而是掌握了人工智能的人类,我们要将这样一些工具掌握在一起。
回望讯飞,1999年开始创业,我们到2004年,五年以后才盈亏平衡,2008年上市,发展到今天,经历了十八年的历程:
这十八年我们将中文语音市场掌握在中国人手里,并且做到全球最好的十八年;
这十八年是我们将整个源头技术创新掌握在自己手里,坚持坐冷板凳而且坚持工匠精神的十八年;
这十八年是我们在人工智能第三次浪潮使得中国不再缺席,积蓄能量的十八年。
未来,我们希望未来有更多更多的伙伴们跟我们一起,让世界来聆听我们的声音,让我们用人工智能建设更加美好的世界。谢谢大家!