登录客服
使用财视扫码登陆 中金二维码

下次自动登录

登录
忘记密码?立即注册

其它账号登录:新浪QQ微信

手机网
首页>>行业>>科技>>  正文
精华推荐 财经号
博客 热门话题 直播

巡航:这点位决定大盘强弱纤虹:科技股暴力反弹

长阳:谁是科技中带头大哥乐章:要当心石油回砸

维持缩量格局小幅震荡为主擒牛:市场诱多还是机会

風雲:盯紧底部翻转个股!泉霳:A股能否持续反弹

云计算+人造太阳+5G概念益兵:周五早间市场信息

雄鹰:仍有惯性上冲的动能光头:利好及其影响个股

一狼:关注弱反弹重要阻力早盘:上升或在不久之后

  • 又一长租公寓爆雷!黄金疯涨,“中国大妈”解套了?
  • 2019年那些翻车的首富们超强台风“利奇马”逼近
  • 全球股市重挫,黄金抢占C位警惕,又一白马股"凉了"
  • 中国单身成年人口超2亿在朋友圈骂人被罚1000元
  • 人民币"破7",央行紧急声明亚洲“整容王国”套路多深
  • 教授建议降低法定婚龄一夜暴富的“锦鲤”女孩咋样了
  • 徐小明 天赢居 寒江钓客 洛阳上官 幽兰行天下
  • 老孙头谈股 秦国安 龍哥论市 蒋律 股海潜蛟
  • 山东虎子 牛家庄 孔明看市 A炼金师 先知窝窝
  • 灵枝 旗帜先明 短线高手 牛传千股 龙头1988
  • 鸿牛 短线王 律动天成 海西一狼 五域论湛
  • 狗蛋 李博文 波段龙一 股市猎枪 涨停板老黄
  • MORE图说财经

    快商通发明单通道电话人声分离技术,拯救呼叫中心单通道语音数据

    2020-04-03 16:09:02 来源:中金在线 作者:佚名
    分享到
    关注中金在线:
    • 扫描二维码

      关注√

      中金在线微信

    在线咨询:
    • 扫描或点击关注中金在线客服

      自声纹识别技术被推广应用以来,声纹库建设的数据来源,一直是从业者们头疼的难题。

      对于金融、保险、证券、市场调研、电商等拥有呼叫中心,并会产生大量语音数据的领域来说,建设声纹库本不是难事,但受历史技术水平的限制,这些领域所存储的历时语音数据来源大多为单通道,客服与客户的声音共存在同一段音频之中,难以分割,无法发挥数据价值。

      最近,快商通Kriston AI Lab发明了一种基于深度学习的单通道电话语音快速人声分离技术(简称“单通道电话人声分离”),破解了复杂场景下的人声分离的难题,将银行、保险、市场调研等行业的呼叫中心历史语音数据变废为宝,大大降低了声纹数据库的建设门槛。
        无需人工干预的电话信道人声分离

      呼叫中心的电话语音,同时存在客服和客户两种不同的声源,如何分辨出特定人物的声音,这对于我们人类来说十分简单,但对于计算机来说,要把一个音频分割成多个不同的语音来源,却要面临很多困难。

      尤其是多人声音重叠部分,分离效果差,且需要采集大量的相关音频进行单独优化,无疑是一种事倍功半的行为。

      Kriston AI Lab提出的这种电话信道人声分离技术,以深度学习的方法实现数据模型训练 , 无需人工干预,便可以将单通道电话信道音频中两个不同说话人的音频进行拆分 ,分别保存,实现端到端的电话信道人声分离。

      电话信道人声分离是如何“炼”成的?

      人声分离分离技术以深度学习技术为基础 , 构建多层RNN循环神经网络。

      1、利用现实生活中电话信道双通道音频作为训练的数据集 , 将电话信道双通道音频合并为融合左通道客服音频和右通道客户音频的单通道音频作为整个模型训练的输入音频,将双通道音频直接读取的左通道音频和右通道音频作为网络训练的标签音频;

      2、输入单通道融合客服和客户音频到整个网络当中 , 网络的输出结果为模型预测出来的拆分客服和客户后的左通道音频和右通道音频;

      3、将模型预测拆分的左通道音频和右通道音频,与原始双通道音频读取的左通道音频和右通道音频进行损失值的计算 , 训练整个模型网络的参数;

      4、当模型训练拟合之后,将模型取出,输入现实生活中电话信道单通道音频,模型输出的音频即为拆分后的左通道音频(客户)和右通道客服(客服)。

      电话信道人声分离能发挥怎样的作用?

      电话信道人声分离的最大作用,便是利用分割后的音频进行声纹库注册,以实现反欺诈、电话营销等功能。

      在银行领域,客服会对逾期不还的订单进行电话提醒,从而产生大量的不还款语音数据,如果彼时该银行使用的是单通道通话,可以应用快商通电话信道人声分离技术对失信者音频进行分割。分割后的音频,便成为黑声纹库建设中历史黑产数据的重要来源。银行可进一步以黑声纹库为基础,准确识别黑名单用户,从源头上降低坏账率,完善金融反欺诈链条。

      在营销方面,使用快商通电话信道人声分离技术,可以对客服外呼电话进行客户音频分割,将客户声音与会员标签、交易标签、营销标签等特征相匹配,统一由后台系统进行管理,实现高质量的电话营销。

      结语:

      技术日趋成熟、政策大力支持,声纹识别这种身份认证方式已逐渐被各领域所认可,但与此同时,种种实际应用问题也浮出水面,声纹库建设的数据来源便是使用者们需要跨过的首个难关。

      Kriston AI Lab从客户使用场景需求出发,推出能够解决复杂场景下的人声分离技术,为银行、保险、证券、市场调研、电商等行业呼叫中心提供了声纹库建设的可行性方案。未来,Kriston AI Lab将持续发挥国际领先的算法优势,完善声纹识别技术与产品的服务能力,推动产业链上下游共同发展。

      附:Kriston AI Lab由快商通于2012年创建,专注于NLP、声纹识别和大数据,现由李海洲教授牵头负责。Kriston AI Lab共申请了400余项发明专利,为医疗、教育、金融、公安、智能家居等行业提供AI技术服务。

       

       

    热门搜索

    为您推荐