自动问答系统的研究与实现

来源 :安徽大学 | 被引量 : 13次 | 上传用户:bobypig_31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统目前已经成为一个研究热点。常见的自动问答系统一般包括问题理解、信息检索、答案抽取,有些基于常问问题库的自动问答系统还包括FAQ模块。本文主要研究了自动问答系统中两个相关的算法,句子相似度算法和答案抽取算法,同时设计并实现了一个金融领域的自动问答系统。句子相似度算法是自动问答系统中的一个关键算法,不仅可以用于自动问答系统中的FAQ模块,还可以应用在答案抽取模块。本文首先介绍了现有的句子相似度算法,并对其优缺点进行了分析,进而提出改进的VSM算法,用于计算用户问题和候选问题之间的句子相似度。对VSM算法的改进是在传统的向量空间模型中添加了语义信息和一定句法信息。改进的VSM算法无需对句子的各项特征设置权重,降低了权值设置造成的计算误差,提高了句子相似度计算的准确性。在答案抽取中,本文对已有的答案抽取算法进行了分析和研究,并提出基于窗口模型的答案抽取算法。该算法通过两层过滤,将句子的词特征信息,语义特征信息以及句法特征信息添加到答案抽取中,利用窗口模型解决了由于分词系统无法识别词组所引起的问题。最后本文设计并实现了一个金融领域的自动问答系统。该系统包含四个模块,问题理解模块、信息检索模块、答案抽取模块以及FAQ模块。当用户提交问题之后,系统首先通过改进的VSM算法计算问题与常问问题库中问题的句子相似度,若相似度大于某个阂值,则直接返回对应问题的答案给用户。反之,则对用户问题进行问题理解、信息检索、答案抽取等操作,从本地文档中抽取出与用户问题相关的答案句子返回给用户。问题理解主要采用现有基于规则和句法分析相结合的方法来进行问题分析;信息检索模块使用开源工具lucene提供检索服务。系统同时使用两种方式获取用户答案,提高了系统的效率,同时还可以自动更新常问问题库,提高了系统的准确性。
其他文献
近半个世纪以来,世界花生生产与贸易规模在震荡中逐步扩大。进入2010年以后,世界花生和花生油贸易进入新阶段,花生贸易规模增速放缓,花生油贸易规模稳步增加。中国作为世界第
党的十九大报告首次提出实施乡村振兴战略,这对促进社会协调发展和实现中华民族伟大复兴“中国梦”意义重大。如何发挥科技对实施乡村振兴战略的支撑和引领作用,是必须面对的一
管弦乐组曲《培尔·金特》是格里格从其《培尔·金特》戏剧配乐中选出8个精彩的音乐片段,经改编而成的两套管弦乐作品。这两套组曲完美展现了格里格匠心独运的创作手法,它是
日本从农地零碎化经营向规模化经营的转变过程中,采取了一系列有效措施推动了农业规模化发展。同样,作为过去以小农经营为主的传统农业国家,日本正处于从传统分散经营的小农
近年来,国内外学者相继探讨企业履行社会责任的本质意义。越来越多来自不同学科的专家都普遍认同承担社会责任是现代企业生存与持续发展的根本。由于我国还处在经济发展的初
2019年6月29~30日,由中国优质农产品开发服务协会联合中国老区促进会、中国农产品市场协会共同主办的第八届全国品牌农商发展大会暨乡村振兴现场观摩会在山东省栖霞市主办,本