基于图书的问答系统的设计实现和关键技术

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zx1q1q1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,人们获取信息和知识的途径越来越多样化,基于常问问题集(FAQ)的问答系统便是其中一个有效的方式。与传统的搜索引擎相比,FAQ问答系统能够直接返回用户所提出问题的答案,提高了用户知识获取的效率。同时FAQ问答系统是自然语言处理领域中一个相当活跃的分支。FAQ的构建与更新、问题的分析与相似度计算等都是FAQ问答系统中的研究热点和核心内容。数字图书馆中有大量专业的图书资源,其中,问答类型的图书通常是针对一个或者多个领域进行专业性的知识问答,因此会形成大量问答对,而这些问答对就是常问问题集不可或缺的部分。并且,相对于其他常问问题集,它们更能够提供专业性强且准确度高的答案。本论文针对问答类型的图书资源,首先对问答系统的研究现状做了详细分析,介绍了问答系统的基本架构和相关理论基础,介绍了基本的分词方法、主题模型、问题相似度计算方法。然后设计并实现了一个基于图书的问答系统。论文的主要工作如下:(1)分析基于图书的问答系统的需求,并针对需求进行系统分析和设计。提出了系统的架构设计和模块设计,实现了基于图书的问答系统并上线运行。(2)针对系统的数据需求,通过正则匹配等技术从大量的图书资源中筛选出问答类型的图书,然后抽取问答图书的目录信息,通过字符串匹配等方法过滤掉其中的噪音信息,最终获取问答类图书中的问题对数据,以此构建FAQ库。(3)重点研究了问题分析和问题相似度计算的相关技术,并结合问题数据的结构、主题和短文本等特征提出了针对图书问题检索的核心算法,包括:基于BTM的问题主题分析,基于Topic和Focus的问题相似度计算。设计相关实验并与传统算法比较,实验结果表明论文所提出算法明显提高了问题回答的准确度。
其他文献
随着科学技术和医用科技的不断发展,中药中传统的“望闻问切”四诊法也面临着技术实现的现代化。‘望’诊,尤其是其中的舌诊是中医四诊的重要内容,它通过观察舌像的变化了解
计算机软件产业发展至今已经经历了几十年的时间,在此期间,有大量的应用软件被开发应用,软件行业是一个快速发展的行业,新旧技术的交替往往带来一个大规模的软件改造过程,在
随着嵌入式系统应用的不断扩展与深入,高可靠性在嵌入式系统的发展历程中正占据越来越重要的地位,成为设计和应用的首要考虑因素。当前,嵌入式微处理器越来越多地被应用于各
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领
多标记学习自出现以来,为各领域普遍存在的多义或歧义性问题提供了有效的解决办法,弥补了传统单标记学习的不足。作为机器学习及数据挖掘方向的一个研究热点,多标记学习已广泛应
医学超声设备的创新思维和技术发展,引导着超声诊断的新技术及其应用。九十年代后期,随着计算机及相关行业的发展,多功能超声影像信息管理技术问世,给临床工作带来了巨大的便
人脸识别技术研究在近几年得到了高度重视,已成为图像分析中最成功的应用之一,更以其出众的特性,成为生物特征识别最具潜力的研究方向。但由于年龄变化会引起人脸产生巨大变
网络规模和应用需求的日益增加,在可用性、可扩展性和安全性方面对软件定义网络提出了新的挑战。以往提出的软件定义网络控制器着眼于在单域的环境下对网络进行管理,尚不能满
随着计算机技术和网络技术的飞速发展,数字作品的信息安全和版权保护成为迫切需要解决的实际问题。作为对数字作品提供有效保护的重要手段,数字水印技术成为学术界的研究热点
无线传感器网络是由大量传感器节点组成的一种无基础设施、自组织的新型网络,作为微电子技术、传感器技术和无线通信技术相结合的产物,在农业、军事、环境、工业控制等领域具