2017年10月27日,易观A10大数据应用峰会在北京召开,本次峰会以“数以致用 源力觉醒”为主题。本次大会邀请到国内互联网行业领袖大咖,以及来互联网、传统企业、媒体及资本领域在内的3000多位与会者,共同唤醒“数字源力”,让用户数据价值得到充分释放和利用。
作为用户势能主论坛的重要组成部分,商业新知创始人黎争、太平保险首席信息官熊明、易观董事长兼首席执行官于与极客帮创投创始人蒋涛,以“数据应用与创想”为主题进行了一场圆桌讨论。以下是圆桌对话的实录:
主持人(商业新知创始人黎争):
接下来我先把咱们这场的嘉宾请上来,他们是:
太平保险首席信息官 熊明
易观董事长兼首席执行官 于
极客帮创投创始人 蒋涛
主持人:杨守彬杨总在先前的演讲中讲非常好,这是一个裂变的时代,有1%的可能成为金字塔塔尖的人,这1%的人一定用好大数据,我们易观方舟这个产品首先是大数据产品,名字起的非常好,我相信在座的各位朋友用上易观方舟都能够进入到方舟里边,都能成为那1%金字塔尖的人。
大数据经过这几年的发展,实实在在的在企业里边在用了,实实在在推动企业的业务发展和创新了。首先请问熊总,保险用户量非常大,首先大数据在您的IT架构里边,以及对你的用户和业务带来哪些实实在在的价值呢?
熊明:从保险行业来说,现在保险行业现在也在经历一个剧烈变化的时期。大家知道前不久众安在香港上市,众安是一家互联网保险公司,它不同于传统的保险公司。因为传统保险公司拥有大量的代理人,众安是做财险的没有代理人完全是线上的模式,所以从保险发展趋势来说,逐渐在从传统的线下行业向线上行业发展的一个过程,也是一个正统。在这个过程当中,大数据不可避免会起到非常重要的作用。
举简单的例子,保险公司现在内部,我们面临简单的问题是,我们在历史上有那么多保单,数据量非常庞杂,我们对现有保单和过去保单,对现有客户和过去客户的分析都是基于大数据。因为现在数据量远远达到不是一台单机能够解决问题的,从这个角度出发,我们商业逻辑,包括对代理人业务员商业上的帮助和对销售上的精准营销帮助都需要对数据做出很多分析,所以从这个角度来讲,大数据不可避免在保险这个行业是不可或缺的技术。
主持人:现在在推动支撑业务里边,成效比较显著的,是在哪些业务层面?
熊明:从我们的角度出发的话,在过去一年多,我们开始发展互联网保险业务以来,我们其实做了很多事情。一个是从基础架构对传统的保险公司进行彻底的革新。比如说组建自己的私有云,在这个基础上搭建基于互联网保险业务的系统,包括销售平台。同时我们其实也需要很多数据从保险公司角度出发,保险公司的数据维度是比较有限的,虽然数据量很大,传统的保险公司获取的数据都是线下数据,都是通过代理人和有限网上方式得到用户的数据。在这方面,如果说保险公司在未来能够跟互联网公司进行结合的话,利用互联网公司获取数据的能力,再发挥保险公司线上线下相结合的销售能力,会获得更好的效果。我们过去一年多在线上线下O2O方式上做了很多尝试。
主持人:大数据实实在在在保险人寿领域里边起到了很大的效果。我们都知道易观已经推出基于移动互联网非常王牌的大数据产品易观千帆,有了这样的王牌产品之后现在又推出易观方舟,是基于什么样的战略层面的考虑,我想您是非常权威的。
于:我借今天这个机会给各位来的朋友和嘉宾,接着这个问题也介绍一下易观的变迁。在2012年之前我们更多用我们分析师出很多的分析,大家在不同的层面看到易观的分析和易观数据。从2012开始到现在我们基本用五年,我们利用技术把分析师做的数据层面的东西,用技术和产品去做。但是我核心关键词是没有改变,核心价值还是分析,只不过之前是用人做,现在是用技术和产品去做,这是一个升级。
从我们做数据分析过去十几年来看,随着整个行业本身每个行业的发展,大家能够积累的数据量越来越多。刚才我接受媒体采访大家问大数据的发展,其实大数据一直都有,包括周末在北大讲一个课,大数据一直有,只不过以前由于手段和方法设备不具备,你没有把这些数据记录下来,但是有了移动互联网,有了手机,有了IOT你记录下来了,沉淀下来了把模拟的东西变成了数字化,这是大数据。但是数据用的过程中,我们发现企业现在有几个阶段有不同的需求,第一寨我们今天所谓的存量市场,整个互联网市场从上半场进入下半场,下半乘心就是存量,在增量市场是跑马圈地,你抢你的,我抢我的咱们打不了架,整个来讲中国经济就是存量市场,但是在存量市耻重要一点就是看竞争,所以,如果要看竞争,一定要做竞争分析,易观千帆就是这样的一款产品,大家到我们的网站去使用,我听我们同事讲,今天来了很多我们的用户和客户在现场,其实都在买我们的易观千帆是做竞品分析是产品对标经营的分析的工具。
就好象今天你去医院体检中心做体检,发现血脂高了,什么原因呢,是没有运动,吃的不合适还是有其他的慢性病在第三方体检产品不会告诉你,但是告诉你你的血脂不正常。过去易观千帆是一个强大的旗舰产品,确实帮助我们很多客户发现他们行业的领先者,如果他作为领先者也行业的创新者在不同层面上的差距和对比。如果我们只是这一款产品就会出现三四年前的状况,客户知道有差距怎么办,我们说没有办法。今天易观方舟是什么,易观方舟就好象你体检之后,你血脂高了我们给你进一步诊疗,告诉你你今天血脂高大家是你没有运动,还是你食物的问题,还是你有什么其他慢性疾病没有发现,易观方舟是一款第一方分析产品。之前朱总讲的时候实际是嵌入我们业务流程,你现在用去流失到你的渠道就是李鬼渠道不是李逵,还是说你光注重数量没有注重质量,还是这些客户来了之后你服务体验没有跟上导致的问题。所以我们做了易观千帆强大的第三方产品之后我们又做了易观方舟,我们告诉你如果出现了与参考值的差别怎么办,我们给你具体的诊断和治疗的方案,这是我们易观方舟原始的想法。
虽然今天正式发布,之前在一些用户客户做了测试,反响非常好。易观方舟这款产品是市面上唯一一款把第三方数据和第一方数据打通的产品,在中国市场是没有这样的产品。
主持人:原来咱们做监测设备和监测师工作的,现在要开医院我们做诊断要开治疗方案,大数据企业级服务的高水准医院,是不是这样。
于:其实倪泽望总也是看准了这一点,我们不能仅仅告诉你说对不起你有病,我们得说我们有药我们怎么解决这个问题,我们提供什么解决方案,这是一个核心的,我们也是顺着客户的需求,我们不仅告诉你差异在哪儿我们告诉你怎么解决你的问题,让你有更多高质量用户沉淀在你的企业,沉淀在您的产品上。
主持人:于总你讲到2012年之前,主要还是分析师的方式进行分析,2012年之后利用大数据的分析所以我想问一个问题,通过五年的发展,咱们易观有很多技术力量,技术产品的力量,咱们分析师这块,究竟是被替代了,还是说又升级了。
于:你的问题特别好。
第一点,我们分析师过去和今年和未来都是易观特别强大的优势,特别当机器干了很多原来需要人去干的重复性数据的采集清洗挖掘之后,我们分析师实际是提升它们在整个价值链往上走,他们可以基于我们已经购买大数据的客户的需求,我们基于应用场景深度的分析,但是一定基于我的产品和工具箱去做的,而不是盲目的做分析。
第二点,易观有一支懂业务场景的分析师团队,最终数据一定进入业务场景。举个例子,我们经常接到大量的骚扰电话,之前也有一些保贷和地产的经纪给我打电话。大家想今天你想租一个房子,给孩子买一个保险,这时候打电话过来你就会想聊一聊,再次证明其实大数据是可以让无为的骚扰降到最低。比如熊总的太平保险,线上线下有很多的尝试,我们最近也在跟其他保险同仁做一些交流和合作,保险今天来讲保贷的模式还是普遍的模式,先找到这个人。如果用线上的画像更准的知道他要什么,这时候你找他的时候就有的放矢这是想说明的是,大数据可以把保代的精力节省下来去做其他的事情。因为在其他的行业也会出现,比如现在很多银行客户卡业务和电子银行业务,特别卡业务你怎么精准的找到这些业务,这时候全景画像就变得特别重要。
主持人:你说这点我自己身有体会,我自己总结了一个词叫互相伤害,当用户没有需求的时候你硬推给他,他本来把时间可以开发有需求的用户,还有就是伤害了用户,所以当我们用很好的数据分析手段解决这个问题的时候可以避免互相伤害。接下来的问题是给蒋总,相信很多人非常熟悉他是技术出身,创办了中国最大的程序员的社区,现在做投资,你做投资这么多年对大数据的发展是怎么看的。然后你投资大数据公司的时候你的评估维度是什么?
蒋涛:大数据,我们因为是开发者最大的数去我们有五千多万的用户,我们也办大会都是偏技术的大会,我们办云计算的大会办了八年,大数据大会今年是第6年,第一届办的时候是七年前,参加人数是20人,那时候大数据代表我们从技术层面来的。我们看到了技术的发展,从七八年前到现在,我们能够看到大技术数据越来越成熟,应用到各个行业,所以从我自己投资来讲,第一个维度投资技术出,又在做技术产品的人,包括刚才深创投投的星环,最早星环的前身是因特尔hadoop的团队。我们投了数据库聚三(音)我们投的厂商是红象(音)还有一家聚合数据。你做大数据首先得有数据,数据在哪儿,第一你们自己家里,第二互联网上,互联网上有大量的公开信息对每个行业都有作用,问题是你怎么用它,聚合数据公司就把互联网上公开的,可以公开的数据做成接口提供给开发者,提供给各行各业,你在这个基础上再做应用,从基础技术,只要做跟大数据相关的用到的技术。第二做技术的应用层,这是我们投资的第一个维度。
第二个维度更重要的是说你有了这些技术你用在哪儿,用在什么样的场景和行业,你怎么用这里边有很多可以挖掘的。今日头条其实是一个大数据公司,它用爬虫的技术和个性推荐的技术,把互联网上所有公开的新闻抓起来提供给我们读者,提供给用户。我们自己投了几家,它抓到一个特别好的很大的一个风口,之前所有人没有预计到,我们投了一些类似的企业在不同的行业用同样的技术做,有做跟投资相关的,投了两家公司,一个是IT橘子(音)也是把互联网上公开的投融资信息进行抓韧处理提供给大家,这是创投的一个数据苦。还有一家是起名片,同样的逻辑在这个领域继续做,在微信公众号大家可以看,把创投的数据做的非常的细致。还有一家也是这样的,我们投的都是这样的第一我们能够把信息抓进来,但是用在哪儿这家用在创投了。第三家我们也投了,原来做的方向没有做出来,现在想做娱乐头条,他们是高能物理出身的,做出感觉,后来做了个转型,这一年发展特别好,他同样也是抓去联网上信息,抓取企业信息,做什么呢,做二级市躇金的分析报告,你想知道唯品会明天发财报,财报收入涨还是跌,用户活跃度涨还是跌,其实你通过分析唯品会的数据。比如说监视微博的动态,你是可以做出一个预测的。目前这家公司做到的准确度到90%,所以现在美国很多做二级市场做概念股的基金都在买我们的产品,这是一类我把公开的信息来做应用。当然互联网金融,包括信息服务是最容易看到的。
第二类你要加到这个行业里去,大数据加到这个行业又产生了两个维度,第一个维度就是没有数据我们要产生数据,因为很多行业,要么数据源基础不具备,要么有很高的壁垒,我们找一个点打进去。比如我们投资教育的叫批改网,通过人工智能的手段批改作文,我们累积批改了2.5亿作文,1200家高校利用我们的产品,所以在教育行业里边创造出来原来没有的数据,作文的批改被数字化了,所以这是一类破局的。
还有一类就是这个行业里边数据不公开,怎么办,现在我们就投资一些什么样的企业呢,投资一些SAAS公司,信息化公司,基础的信息化,基础的数据采集,包括优质的数据积累,可能都还没有,所以这一类,前两年我们也陆续投了一些所谓基于SAAS的2B的行业,包括医疗领域投资一些企业,他们的价值可能是信息服务和SAAS服务商,但是未来通过数据的增值和行业数据深度的积累,我觉得这样的大数据公司会慢慢的冒出来,但是行业的数据公司成长比较慢,大家需要等一段时间。或者我也建议我们这些有技术能力的我们的团队也好,能够深入到这些行业里边去,应该说能够挖掘出特别多的场景和特别多的机会。
主持人:谢谢蒋总,大家从事大数据创业想法的,是不是蒋总说的三个维度,可以进行交流。我们大会的主题叫数以致用,我们看大数据的发展有一个争论,或者说讨论点,一直也没有断,就是大数据和小数据的关系。杨总讲的时候,讲了两个关键词个性化、精准。其实你在使用的时候,个性化精准是小数据,但是你要完成个性化精准你需要大数据分析,所以关于大数据小数据的分析怎么用,我想听听三位嘉宾的观点,未来大数据跟小数据交织发展会发生什么样的变化,尤其在利用市场方面,先从熊总开始。
熊明:从我自己的看法来说,我之前在谷歌做广告,从这点来说我先谈谈对保险的认识,保险传统是基于大数法则,基于一个人群进行定价,现在保险发展方向很有可能实现一定的颠覆,就是刚才我们所谈到的个性化。因为现在定价的话有可能越来越基于一个人的具体情况进行定价,所以从这个角度出发,大数据本身在保险行业,我们预料会发生非常大的作用。也就是说对传统的结算形成很大的挑战。
那么从另外一个角度出发,从我个人的经验来说,我觉得在过去的十年,数据的发展,特别是以互联网公司为代表中国这几大BAT巨头,包括美国的谷歌、facebook公司他们对数据接轨非常相似。从他们角度出发用户的数据在线上都可以收集,他们根据收集的数据会对自己所需要的业务做出一定的分析,所以早就已经像大数据方向发展。而我认为在这个方向上最重要的是两个问题,一个是问题是你怎么样得到大量的数据。
比如说在国内我们BAT公司有办法得到大量的数据,但是做大数据很多公司数据量不是那么大是非常有限的。另外你怎么样帮助垂直的行业利用数据提升它的商业,如果你的数据不能够变现,不能够产生价值的话,光有大量的数据也是没有作用的,所以未来大数据的公司的话如果能够做好这两点的话,可能对大数据行业产生非常好的影响得到提升。
蒋涛:数据好像听起来来讲越多越好,要获得越多的数据带来的成本和要求也越高,所以比较重要的就是我们看到还是数据的质量和多样性,就是优质的数据。我们发现有些行业累积的数据要么数据不完整,要么数据没有质量,数据后面还是要做分析和决策的,如果数据太单一的话它的应用价值就没有那么大,这是第一个重要的,实际上我们对数据是有一个分级,你最好有专业标注的高质量的数据,这比你获得大量没有标注的数据价值要高非常多,这是第一个。当然在这样的前提下,当然是多多益善了。
第二个是跟技术有关系,现在之所以技术的突破是因为深度学习的突破,深度学习的算法跟原来有很大的不同。原来我们用的传统的人工智能,包括回归这些,它的样本到一定的数量,它得出来的结果就在那个水平线上,你再给我多十倍的数据我也不会提升,这是基于大数法传统的AI方法。但是基于这个呢,你给它的数据越多,产生的价值越多,随着数据量的增大越来越高。如果你的行业场景是需要深度学习分析的话数据量越多越好,当然科学家和我们专业工程师的数据不可能给你,怎么办,就有新的技术就是阿法元(音),我们自己通过增强学习,通过各种GN的方法创造数据,所以技术的发展大家要关注,这也是这几年投资有一个非常,要投科学家,要投算法工程师,因为技术带来很大的差别,最近两三年技术公司的股指都是天价,他们技术对你原来的应用是十倍或者百倍的提升,这是现在关于大和小数据的我的一些看法。
于:我觉得这个问题特别好。从易观实践来看,我们觉得大数据更多是找规律、找特征、找趋势。而小数据更多是找个性、找特点、找具体的抓手,这两者结合一定是我们企业应用场景中要出现的,这是从定性来讲我们的看法。
结合易观的产品,我也讲一讲大数据、小数据是什么意思,比如易观千帆是一款体检产品,它实际就是大数据去找特征趋势的产品,是统计性的产品。我们其实是把这些数据通过对我们机器人进行训练,学习及验证之后找出一些规律性认识反映在易观千帆上,我经常问易观千帆数据怎么来,其实我们数据都是用机器人写出来的,所以我们经常在上新的,如果大家关注我们的产品,会发现我们最近上了A3算法,我们用很多灰度算法同时测试,有一些不合适我们就回稳了,如果合适我们就调优变成真正的算法,这是我们大数据在我们产品中的应用就是易观千帆这款产品。
但是具体到说,还是说你的用户今天流失比较快,比如我今天做医疗健康问诊应用的,或者我今天做共享单车,到底存在我什么问题呢,这个就去小数据去看。易观今天来讲,我们覆盖的月活用户9月30号超过5.2亿,日活用户7800万,除了腾讯微信QQ以外我们基本是第三大用户群,相对这样的大数据,99.9%我们正在和潜在客户,他们数据量都没有我们大,相对是小数据,但是在这个当中是强耦合的,我转化率低到底是什么原因,我用户流失高到底是什么原因,我们易观方舟对这个进行诊疗。
实际上我们还有体检诊疗,我们吃药就是标签,比如你是招行用户,招行对你非常了解,但是这些用户不可能他生活的百分之百只在你的场景,还有其他的场景,怎么办你肯定不了解,这需要增补标签做到最全景画像,从而有针对性的推产品和服务,这时候是一个小数据,具体个案可能就是一百个客户,一千个用户我把他召回这是小数据。吃药之后效果怎么样,再去体检,之后再诊疗,其实也是比较好的解释了大数据小数据是怎么用的。
最后就是蒋涛说的,我们在日常工作中,即便我们有这么大的数据量我们也很头疼。
第一数据噪音特别大,很多数据噪音多达40%-50%,清洗非常麻烦。从机器角度来讲,40%是假的,剩下60%