李飞飞、吴恩达、张潼、马维英、Pieter Abbeel、Oussama Khatib……;腾讯、阿里、今日头条、滴滴、科大讯飞、唯品会、斯坦福、UC伯克利、清华……集齐全球顶尖的AI领域领军人物,踏访中美两国科学研究及应用探索前沿的科技公司/大学的AI实验室,浓缩在飞越太平洋的9天内密集拜访和交流,这是一种什么感受?
一句话:大脑的“CPU”、“存储空间”和“接口”都已不够用。
9月14日-22日,红杉中国携手真格基金,定向邀请三十余位成员企业的创始人和高管,一起享受了一场智能超感的“北京-硅谷AI双城记”之旅。这是一次名副其实的大脑体操,对于在各个垂直领域已经取得初战胜果的创业者们,这更像是一趟寻找AI+商业“终极算法”的解惑之旅。红杉资本全球执行合伙人沈南鹏和真格基金创始人徐小平也参与了“AI双城记”硅谷段的部分活动环节,两位都非常关心AI产业将对教育领域带来哪些改变。
红杉资本全球执行合伙人沈南鹏:人工智能是信息科技高速发展的重要产物,如果企业家能够把握好未来5-10年市场研发方向与机会,应当可以获得前所未有的长足进步,获得跨越式发展。
真格基金创始人徐小平:工业时代是把流水线上的人变成机器,而AI时代则是把机器变成人。AI的广泛应用,如果能够极大提高生产力、极大地解放人类,将是非常了不起的事情。
红杉中国为什么要做这件事?
从计算时代、网络时代到AI时代,是红杉资本与全球技术创新浪潮并进的45年。即使你已熟悉车库故事、多次到访沙丘路,但你仍然可能对硅谷——这片长约25英里的狭长谷地有所不知。从早期的通讯技术研发基地,到半导体巨头的摇篮;从斯坦福的工业园,到风险资本的初始之地;从软件、互联网的勃兴,到今日AI之风劲吹,硅谷已成为全球技术变革的代名词,并一次次挺立于创业创新的潮头。
在计算时代,红杉资本发掘了苹果、投资了Oracle、思科……;在网络时代,它投资了谷歌、雅虎、领英、YouTube、Airbnb、阿里巴巴、京东、滴滴、今日头条……;现在,当科技世界叩响AI时代的大门,它再一次以超越科技跃进和市场波动的眼光,把握先机,提前布局。
搭建中美AI前沿对话的平台,投资早期AI创新创业之新荷。红杉中国致力于成为顶级高成长企业最早、最重要的投资人,作为创业者背后的创业者,不仅是发掘和以资金资源支持创业新秀,更不一样的是,给予创业者以成长帮助并陪伴长跑。怎样为创业者打开世界观?红杉中国愿意成为AI前沿对话的“搭桥者”、“造雨人”、“连接器”,为创业者提供有针对性的高端对话机会,搭建更广阔的深度互动交流平台。
红杉资本中国基金合伙人周逵带队参与了北京段的参访行程。他说,组织这一愁动,初衷是给红杉中国投资的AI领域成员企业提供实际有效的帮助,为此主办方为每一站活动主题都尽量做了细化、聚焦,希望令所有参与人的兴趣点更加集中,沟通更有效率。
红杉中国今年已举办了近十场类似的投后服务活动,希望通过这些高质量的交流活动,帮助CEO了解到产业核心企业的动态和想法,认识行业最牛的人,做最准确的业务判断。
在为期9天如此密集的知识大爆炸中, 我们和“AI双城记”的团员们一起,不仅和“机器之心”同频共振,还与如此之多的“最强大脑”超距连接,大家都收获到了什么?
敲黑板!敲黑板!以下是我们的随行笔记,要划重点了:
01
未来竞争的壁垒不再是算法,而是数据拥有的量和质。
从1950年代中期人工智能概念的第一次被提出,及至今天出现的三次人工智能浪潮,各类算法已趋近成型。而从应用层来看,监督学习、迁移学习、非监督学习、强化学习这四类算法所创造的经济效益是递减的,就目前而言,AI技术做出的经济贡献几乎都来自第一种:监督学习,也就是让机器学会从A到B,从输入到输出的映射。它依靠结构化数据,确实比非结构化数据创造了更多的经济效益,并且已经扩展到在线广告、消费金融、语音交互、机器翻译等应用场景中。
此次拜访的多位AI大牛都谈到,当算法模型的优劣已不再是关键差异(就像所有安卓手机都系出安卓平台),未来科技公司在AI应用上的较量更多取决于谁拥有更多、更好的数据。以及,怎么策略性地持续获取更多数据。
如此图所示,处于金字塔顶端的结构化数据,将是任何一家公司的宝藏。
02
建立数据获韧训练的飞轮,对手就很难追赶你。
在此行“AI双城记”中,创业者向谷歌云机器学习与人工智能首席科学家李飞飞教授提出了这样一个问题:大公司毫无疑问拥有巨大的数据获取优势,那么创业公司还有机会吗?
李飞飞的回答是,大公司在获取跟自己产品相关的数据方面,这一优势肯定是无法匹及的。但是,AI应用的场景是多种多样的,在许多领域还有待开掘。对于初创公司来说,怎么通过产品来撬动数据获取才是最重要的。
吴恩达也持同样观点。他在白板上一边画图一边解释:一家新公司需要特地设计一个循环:先为算法收集足够的数据,这样就能推出产品;然后通过这个产品来获取用户,而用户会提供更多的数据……启动了这一飞轮后,对手就很难追赶你。
以今日头条为例。今日头条副总裁、人工智能实验室负责人马维英在分享中亦提到,用户使用今日头条越多,会发现它越智能。原因就是,用户会在使用时不断喂给机器第二轮大数据:他的偏好、点击次数、停留时长、负向反馈……从而让头条更懂用户。
就如同互联网时代已经发生过的故事那样:大平台之外,还有诸多垂直细分的数据领域有待挖矿。
03
大数据不追求因果性,更追求相关性。
原因是,只依据统计数据是不足以得出变量之间的因果性的。想要得出因果性,必须从理论上证明两个变量之间确实有逻辑上的因果性,并且要排除掉第三个隐含变量同时影响这两个变量的可能性。就像著名的啤酒尿布的故事,它只是说明这两项商品的购买人群中存在较大概率的重合度。
正如“AI双城记”团员、唯品会美国研发中心总经理、AI负责人谢楠在分享中提到AI 技术有几大趋势:算法“开源化”,计算“云服务化”,数据“私有化”。因此,就算法、数据和运算能力这三大 AI 要素来说,企业最需要建立起壁垒的是数据。AI的商业应用与学术论文研究有所不同,算法模型的准确率不必是唯一的研发目标。在有限的时间与资源的情况下,也许有商业ROI 更高的研发目标,譬如算法对某业务场景的覆盖范围。在特定的应用场景中,80%的算法模型准确率可能就可以做很多过去做不到的事情。如何在不完美准确率的情况下构建一个可行的商用场景是真正挑战商业AI实践者的地方,需要对业务及客户需求有深刻的洞察与理解。
04
传统科技公司 + 机器学习/神经网络 ≠ AI公司。
吴恩达分享的主题就是:当AI成为新的电力,它将怎样改变世界?
AI的崛起正在改变公司间竞争的基础,那么,到底什么才是真正的AI公司?吴恩达首先谈到了互联网时代,究竟如何定义什么是互联网公司这件事——商场 + 网站 ≠ 互联网公司。
“我认识一家大型零售公司的CIO,有一次CEO对他说:我们在网上卖东西,亚马逊也在网上卖东西,我们是一样的。”但其实不是的,互联网公司应该如何定义呢?不是看你有没有网站,而是看做不做A/B测试、能不能快速迭代、是否由工程师和产品经理来做决策。这才是互联网公司的精髓。
同样地,现在经常听人说“AI公司”。在AI时代,我们同样要知道:传统科技公司 + 机器学习/神经网络 ≠ AI公司。吴提出三个衡量维度——
第一,AI公司倾向于策略性地获取数据。
第二,AI公司通常有统一的数据仓库。
第三,普遍的自动化以及对人工智能产品经理的新定位(从哪儿获取数据,如何获取数据,对数据精准度的要求)。
05
机器学习就是,让机器学习怎样学习。
OpenAI研究员、加州大学伯克利分校教授Pieter Abbeel,和OpenAI创始人、YC总裁 Sam Altman在与“AI双城记”团员的分享中,均提到了他们的最新研究方向——在小数据的前提下发展 AI:让机器学会“学习”,在自训练(self-play)中训练智能体。
Pieter Abbeel更为具体地提到了一个有效的方法——元学习(Meta Learning):给系统很多训练数据,最后得到的是一个自学习的系统,它会随着获得的数据进行更新和快速的学习。
这颠覆了传统的深度学习模式必定需要大量数据集的情况,意味着其实深度学习也可以在少量数据的情况下,得到不错的结果。
其中一个应用领域就是医疗诊断。对于一些发病率并不那么高的肿瘤类疾病,无法获得大量CT数据来训练机器学会识别肿瘤,就可以使用类似的相关联数据进行初步训练。红杉中国Family成员企业推想科技正是这么做的。其本质就是,教会神经网络怎样从模仿人类行为,到自主学习,犹如婴儿的成长。
06
AI应用需要从进化力、执行力上升到理解力。
阿里巴巴的技术专家们这样谈到他们对AI应用的理解:
进化力是互联网公司的看家本领,在网络时代,可以比传统企业更快速地迭代、试错、响应用户需求,而这正是开发AI应用的一大优势。
而上升到第二阶段就是执行力——你能够连接服务的数量、被新的交互手段所赋能的执行力,就变得非常重要。也就是怎样让AI真正在实际场景中应用起来。
再往前推演,就是理解力。怎样让AI自我学习、自我进化,理解环境、人的需求甚至具有自我意识。从计算、算法到数据,都对机器的理解力提出更高的要求。
由此看来,进化力体现在AI在商业上的浅层次应用上;而执行力则会考虑企业是否能够用AI改造自我基因,转变为真正的AI公司;在理解力层面,则意味着,AI不仅是机器处理流程的自动化,单纯替代人力的机械性劳动,而是具有创新创造的能力。
07
没有改变的用户需求仍然是这两个字:“爱”和“怕”。
在万紫千红的移动互联网时代,从用户需求的角度来说,几乎所有服务应用其实都可以归为这两类:“爱”,让用户享受到便利、折扣、好处、愉悦,于是越来越沉迷其中、爱不释手,社交、电商、游戏、文娱、资讯、工具类APP均可以归为这一类;“怕”,则是让用户拥有免于某种恐惧的自由,比如杀毒、隐私、医疗、安全类应用。
在不同时期,解决这两类需求的新方式,总会带来新的商业机会。AI时代亦会如是。
滴滴信息安全战略副总裁、滴滴研究院副院长、Didi Labs负责人弓峰敏博士是硅谷资深的信息安全专家,他谈到了AI时代将会面临的各种可能的技术安全问题,可一窥硬币的另一面。
在他看来,机器学习本身的确增加了方法和模型的复杂度,和软件时代一样,复杂程度本身就是一个可能引起更多漏洞和威胁的弱点。但在今天来说,AI应用引发黑客攻击的可能性实际上已经不是新鲜的事情,越来复杂的机器学习,已经有对抗的味道在里面了。这意味着,机器需要做更多自适应的学习,不断更新,去应对可能出现的安全风险。
从另一方面说,给机器喂的训练所需的数据时就要考虑到,其应用场景是什么样的,对于噪音、干扰、信息污染的承受程度是怎样的,如果预见性差,很可能致使这一学习系统被误导,其学习结果也相对不会理想。
也因此,解决AI未来应用的安全性问题,也会是一个蓬勃兴起的新领域。
08
AI时代,人类将真正第一次在最本质意义上复原成“智人”。
越过奇点后,人类的工作越来越多被机器替代,人还何以为人?关于这个问题,已经让社会学家、未来学家和经济学家争论许久。真格基金联合创始人王强老师在此次“AI双城记”的一次分享中,谈到了他的理解:
“这一场AI越来越凸显特色的智能化革命,实际上就是两个方向。一是不断释放人的大脑所承载了千百年的所有功能,这是继工业革命之后,释放人脑潜力、释放人力资源的又一次革命。用越来越用智能化、高效率的方式,来替代人脑不应该承载的任务。
“另一方面,当人脑的部分工作被人工智能所解放,它必定在呼唤着新的东西。就像人作为灵长类高等动物,古生物学家给人类的祖先命名为‘智人’,随着AI的不断演进,可能人将真正第一次在最本质意义上复原成为‘智人’。”
不仅是AI在学习人类,人类也在和机器的互动中学习。就像围棋高手们也从AlphaGo的很多新颖的走法中获得启发。相信在未来世界,这样的交互会越来越频繁的发生,对教育来说,AI将带来一些重要的改变,从教育产品到教育本身都会有,它会让人类变得更聪明。