智能客服问答系统关键算法研究及应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:proshyrain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,很多领域的企业以及运营商都提供线上产品服务,在客户量增长的同时,人工客服的需求量也激增,而智能客服系统,能够以准确、简洁的检索结果回答用户用自然语言提出的大量重复问题,可以帮助减少大部分人工客服的工作量。因此,研究智能客服问答系统具有很大的实用价值和应用需求。本文从提高系统的准确率和效率的目的出发,深入研究了智能客服系统的关键技术,对问句分类技术和问句的相似度技术进行了深入研究,主要工作有以下几点:首先,本文在k-means聚类和朴素贝叶斯分类算法的基础上,提出了NBKC算法。该算法优化了k-means聚类算法准确率较低和朴素贝叶斯分类算法分类效率低的问题。首先对样本进行k-means聚类,将聚类结果中的正确问题集用来训练朴素贝叶斯分类器,并使用该分类器对聚类结果中的错误问题集进行二次分类。实验表明,改进的NBKC算法针对无类别标志的问句样本不仅可以快速分类,还具有较高分类的准确度。其次,在分析了SimHash相似度、语义相似度和语序相似度特点的基础上,提出了一种将三者结合在一起的混合相似度算法。首先使用SimHash方法进行快速过滤,保留FAQ库中与用户输入问句相似度小于等于阈值的问答对,然后再通过语义相似度和语序相似度相结合匹配出最相似的问句,并返回对应的答案给用户。实验表明,该混合算法能够很好的兼顾系统的查询准确度和查询的时间开销以满足用户的查询准确率和速率的需求。最后,本文在基于以上两个改进算法的基础之上,分别从需求分析、总体设计、详细设计和系统实现4个方面,实现了一个基于受限领域的智能客服问答系统。
其他文献
在能源开发、环境保护和完善电网建设的多重需求之下,以可再生能源为主的分布式发电技术在近些年来受到广泛关注,得到飞速发展。分布式发电(Distributed Generation,简称DG)
以报春石斛、金钗石斛和鼓槌石斛成熟叶片为材料,通过对一定光照强度梯度下光响应曲线和相关参数的测定,研究了温室栽培条件下冬季石斛叶片光合作用特征。结果表明:冬季石斛可利
汉语词性标注作为自然语言处理领域的基础性研究课题之一,近年来受到广泛的关注和深入的研究。词性标注的研究成果可为信息抽取、汉语语义分析等其它高层处理任务提供必要的
<正>据《法制日报》记者于呐洋报道:9月20日,全国司法所建设工作会议在吉林省长春市召开。司法部部长吴爱英在会上讲话指出,司法所是司法行政系统的基层组织,是整个司法行政
叔本华依据其"意志之自我否定"的哲学思想提出"同情是道德唯一的基础"的重要学说,但他的后继者尼采却以"权利意志"作为重估一切价值的标准,彻底否定了同情理论的价值,进而颠覆了叔
技工教育是专业性、技术性比较强的职业教育,对从事技工教育的教师有着与普通教育不同的特殊要求。然而,现有技工院校的教师普遍存在两个问题:一是部分技校教师往往只关注学术
变压器保护需与相关出线等配合,整定计算原则复杂,开发能够提供灵活自定义整定计算原则的变压器保护整定计算软件有利于提高软件的通用性。分析变压器保护整定计算系统的结构
综观世界各国或地区的发展史,建立完善的农技推广服务体系是促进农业和农村发展、保护农民利益的最重要、最普遍的举措之一。目前北京市农技推广工作与先进国家或地区相比还存
目的探讨分析实施全程护理干预对预防冠脉介入诊疗术后拔鞘并发迷走神经反射的临床效果。方法选取2014年5月-2016年10月在我院实施冠脉介入诊疗术的患者120例,将其随机分为对
指出图书馆阅读推广的系统理论包含着过去和现在、阅读与阅读知识、阅读推广根本理论、阅读推广管理与服务5个方面。这些系统结构理论不断更新和发展,图书馆阅读推广体系理论