国双司法大数据事业部咨询总监舒怡女士出席9月17日第六届全国社会媒体处理(SMP 2017)大会企业论坛,和与会人士分享国双如何运用知识图谱等人工智能底层技术,协助最高人民法院出版社搭建“法信”平台等实践经验,逐步构架智慧法院,促进司法智能。
国双司法大数据事业部咨询总监 舒怡
国双在司法领域能够具有专业化的深耕能力,是依托国双十余年来在商业智能、广电新媒体、电子政务、工业互联网等多个领域的大数据实践经验与技术积累,得益于专业的技术、优秀的数据分析处理能力、先进的大数据工具以及顶尖的行业认知。舒怡在针对国双司法大数据的底层核心技术「知识图谱的搭建应用」分享时讲到。就司法领域而言,有法律法规、判决文书、领域知识等多种类型的海量数据,搭建知识图谱能很好的满足数据关联、知识拓展和应用支持。司法知识图谱是司法智能应用的基础;架构正确的司法图谱,是促进司法智能的关键核心。
舒怡指出,知识图谱在现阶段要解决的问题就是实现数据的智能化处理,让计算机像人一样用知识处理数据。图谱中节点-边-节点组成了表示知识和事实的陈述语句,知识图谱表达知识的方法与人类认知模式相一致,与自然语言表达语义相一致,降低了结构化知识构建和使用的难度。
为什么司法知识图谱是司法智能应用的基础?舒怡表示,法律知识体系是多种逻辑和知识的结合,知识图谱能够表达这种逻辑关联,并显示被关联的体系内的知识。我国是一个成文法体系国家,有条件从单一知识到全领域知识,以较为统一的规范构建司法知识体系。站在技术的角度,在构建知识图谱的过程中,一方面要结合自然语言处理技术,从大规模数据中总结知识构建的模式;另一方面专家必须对建模过程中的机器进行监督和训练,让机器不会因为数据稀少导致的缺失和错误。这一点,正是国双技术团队以及具备专业司法从业经验的专家团队彼此无缝融合,所展现的过人竞争优势。
事理图谱是一个非常新的概念。哈尔滨工业大学首先提出事理图谱的研究内容,认为人们的社会活动往往是事件驱动的,事件之间在时间上相继发生的演化规律和模式是一种十分有价值的知识。而国双跟哈工大在相关研究上进行深度交流。舒怡表示,国双司法大数据目前另一向研发重点就在事理图谱与知识图谱融合搭建。因为判决的作出都是基于不同主体在同一时序内的相对行为及形成的客观结果作出的。将事理图谱应用于司法领域是一项非常有意义的尝试,特别是在裁判结果的预测上。
舒怡指出,国双公司正结合事理图谱与传统知识图谱搭建司法图谱,尽可能模拟人类的思维模式「干什么、怎么干」,让司法大数据更智能地协助司法工作者。事理图谱与传统知识图谱必然成为智慧法院的技术底层。
全国社会媒体处理大会企业论坛旨在搭建平台,让主要从事相关技术的企业,与各方分享与社会媒体处理技术进展、分析行业发展趋势,使之有效增进校企合作、产研结合之外,并能促进相关领域的高校人才培养,更好的服务社会。此次企业论坛由国际关系学院副教授李斌阳先生主持,分别由新浪微博高级架构师刘博先生、三角兽合伙人兼首席科学家王宝勋先生与舒怡女士,从各自企业的研究领域通过机器学习、自然语言分析等人工智能技术解决不同应用场景的问题,进行分享。
关于国双:
国双(Nasdaq:GSUM)是中国领先的云计算企业级大数据分析和人工智能解决方案提供商。基于国双大数据平台独有的分布式数据架构和先进的实时、多维度关联性分析技术,国双的解决方案能够使客户充分洞悉数据间的复杂关系,获得全新的商业洞察,以利企业和政府客户作出更好的业务决策。“国双(Gridsum)”其名,是分布式计算(Grid)与分析(Sum)的结合。作为数字智能化的先行者,国双致力于帮助企业和政府客户以新颖有效的方式使用数据,提高生产力。