基于机器学习的客服语音智能质检系统的设计与实现

来源 :河北师范大学 | 被引量 : 1次 | 上传用户:sprach
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客服语音质检是热线服务运营中一个非常重要的质量控制环节。传统的客服语音质检系统通过人工对照考核标准表听取录音,主要以抽检方式进行,质检效率低且覆盖面小,本文设计与实现了客服语音智能质检系统,利用机器学习中的卷积神经网络CNN(Convolutional Neural Network)模型,计算文本相似度,求出偏差率,进行质检评分,自动化程度高,覆盖面广,大大提高了质检的精确度。本文分析现有的客服语音质检的现状,对河北斯博思创新科技有限公司客服部语音文本数据进行深入研究,通过需求分析,设计总体框架,实现了基于机器学习的客服语音智能质检系统,主要的研究内容如下:(1)数据的获取。数据来源于河北斯博思创新科技有限公司历年客服语音数据。(2)数据的预处理。首先对获取的原始文本进行数据清洗,利用Hanlp分词工具进行中文分词、去停用词。(3)模型的选择。提出两种文本相似度模型,一种是基于文档向量的文本相似度模型,另一种是基于CNN的文本相似度模型,利用公司历年客服数据作为数据集,计算两种模型文本相似度,结合质检标准分别求取偏差率,基于CNN文本相似度模型的偏差率介于0.05-0.06,基于文档向量的文本相似度模型偏差率介于0.12-0.13。实验表明基于CNN文本相似度模型偏差率低、正确率高,所以选择了该模型用于质检。(4)模型的训练。采用Word2Vec算法训练词向量,建立词向量模型。经过Word2Vec算法的处理生成语义扩展矩阵作为CNN的输入,建立两个完全相同的CNN层次组合模型,全连接层产生高级语义,最终利用激活层的Sigmoid激活函数进行输出,以此判别属于某类概率,再用概率判断文本相似程度。本文的创新点,把卷积神经网络CNN模型计算文本相似度引入客服语音智能质检系统,基于B/S架构设计与实现了客服语音智能质检系统,该系统主要完成了自动化质检评分、语音信箱管理等功能,通过应用能较好地满足企业对语音质检服务的要求。
其他文献
斑点叉尾鮰又称河鲶、美国鮰鱼,在美国和墨西哥北部均有分布。生活在水质无污染、沙质或石砾底质、流速较快的大中河流,也能进入咸淡水水域生活。斑点叉尾个体大、含肉率高
随着全球金融市场间的联系日益紧密,国际金融现已成为人们日常生活不可或缺的部分,越来越多的中国读者关注金融类书籍。为了满足读者进一步获得国际金融知识的需求,翻译英文
在第十五届深圳服交会的现场,一个四溢着清新自然风格的童装展位显得特别天然环保而又“正能量”。  对于一个初生童装品牌来说,G100童装第一次的深圳服交会显得既令人紧张又充满期待。  “我们的品牌刚刚诞生不久,这次展会主要是想要拓展更多线下的客户。”G100总经理宋薇这样说:“经过一段时间线上的摸索,我们发现还是需要寻求更多的线下伙伴,将线上和线下结合起来,这样效果会更好。因为我们的产品拿到消费者手
在全国土地市场不断发展,市场制度进一步完善的大背景下,重庆土地市场也进入了市场化发展阶段。商品住宅用地作为经营性用地的重要组成部分,房地产市场发展的重要支撑,其出让
当前,我国正处于脱贫攻坚的关键时期,同时也是乡村振兴战略制度框架及相关政策体系的构建形成时期。精准扶贫即将根本性解决我国农村地区的绝对贫困问题,为下一步实施乡村振兴战略消除基本障碍。作为精准扶贫的重要载体,合作社因其益贫性及带动性在贫困治理过程中发挥多重作用,为乡村振兴战略的实施打下了坚实基础。在乡村振兴背景下推动合作社健康良好发展,既能巩固当前脱贫成果,又能为构建乡村振兴战略的制度框架和政策体系
经编产业很久以来都是欧美发达国家的骄傲,是其重要的竞争力产业之一。随着国际经编产业的转移,经编产业在中国迅猛发展,
近年来,技工学校生源异常紧张,学生整体素质下降,学习能力差,学习兴趣不高,课堂上经常是“教师侃侃而谈,学生昏昏欲睡”,久而久之,形成了学生厌学,教师厌教的恶性循环,这大大增加了技校
2014年4月16日,中国商业联合会、中华全国商业信息中心以“新商业时代下的零售变革”为主题举办的“2013年度(第二十二届)中国市场商品销售统计结果新闻发布会”及“中国零售商
血液灌流是治疗急性药物或毒物中毒主要有效的方法,而血液透析则是急性或慢性肾功能衰竭的替代治疗有效措施之一.我院于2003年6月应用珠海丽珠医用生物材料有限公司生的HA型
胡锦涛同志在西柏坡学习考察时发表的重要讲话中强调,全党同志要重温毛泽东同志关于“两个务必”的重要论述,重温邓小平同志、江泽民同志关于全党全国人民要长期艰苦奋斗重要论