限定领域基于网络的问答系统的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:ziyoucunzai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的广泛应用,网络教育越来越受到人们的重视。由于网络教育中教师和学生在空间上是分离的,沟通与交流就显得尤为重要。因此,答疑系统成为网络教学中的重要组成部分。但是目前网络教学系统主要采用电子邮件、在线讨论和关键字查询三种方式进行答疑,效果均不理想,造成教师资源和答案资源的巨大浪费。 针对上述问题,本文结合分词技术、特征词提取方法、句子相似度测量、.知网应用技术、信息检索模型及评价等相关理论与技术,建立了一个限定领域内基于网络的自动问答系统模型,实现了一个面向计算机教学的问答系统。该系统能够自动理解学生使用自然语言提出的问题,在知识库中查找类似的问题,根据查找结果返回或即时抽取问题相关答案。 本文详细阐述了系统中几个主要部分的设计及实现过程。在问题理解阶段提出并实现了问题分类算法、改进了关键词权重的计算方法。由于关键词权重计算公式的设计考虑了词性、词长、频率等因素,使得其计算更为合理,进而提高了系统问题回答的准确率。FAQ模块主要采用改进的句子相似度计算方法来实现对学生问句的回答,该模块主要用于实现常问问题的快速、准确解答。FAQ库问句匹配算法、引进了关键词权重因子,并将其用于FAQ库问句匹配计算,使得系统计算得到的相似度更具有合理性,查准率有较大提高。系统设计的FAQ库自动更新算法使FAQ库得到及时的更新和有效的维护。信息检索模块中引入索引技术,采用倒排索引方式对文档库建立索引,其检索结果可应用在答案自动抽取阶段。答案侯选句算法能够有效地将最可能成为答案的句子筛选出来,保证了问题回答的正确率。 本文同时给出了系统实验条件及系统评价,实验结果表明,相对于传统的问答系统,本系统通过问题分类后较大地提高了系统回答问题的正确率。本文最后总结并指出基于网络的问答系统具有广阔的研究前景和实用价值。
其他文献
随着信息技术的发展,物联网越来越多的应用到像智能交通、智能家居、智能医疗等的智能应用行业中,以传感设备为基础的各类流式数据的实时接收和处理成为物联网智能应用的关键。
医疗信息系统,是一门容医学、信息、管理、计算机等多种学科为一体的边缘科学。是现代化医院运营的必要技术支撑和基础设施,实现医疗信息系统的目的就是为了以更现代化、科学化
随着Internet的迅猛发展,IPTV正以其越来越强大的力量冲击着传统意义的有线电视,不过在国内,IPTV仍处于商用试运营阶段。IPTV多业务运营支撑系统就是为了适应和促进IPTV业务的发
随着移动互联网、物联网、社交网络等新技术产生和发展,人们已经从信息匮乏时代过渡到了信息过载(information overload)时代。博客、社交网络服务SNS(Social Networking Serv
随着移动互联网和物联网的快速发展,数据开始爆炸式的产生并在庞大的网络上传递,整个人类社会步入到了一个“大数据”的时代,如何存储、共享和利用这些海量数据成为我们当前这个
生物信息学是20世纪80年代末,随着人类基因组计划的不断发展、基因序列和蛋白质数据的急速增加、以及信息理论和计算机技术的不断发展而逐渐形成的。我们可以利用计算机技术对
作为实用化人工智能的一个最新的研究领域,专家系统在社会各领域的应用已经越来越广泛。专家系统的研究方向主要是知识获取、推理机制研究、实时处理以及扩大专家系统的应用范
一篇文档通常涉及多个子主题,然而传统的文本处理系统如信息检索和文本摘要以整篇文档作为基本处理单元,隐性假设文档主要讨论一个主题。如果能够准确地识别和划分文本的子主题
随着交通事业和计算机技术的迅速发展,传统的自然区划已不能够全面的、正确的认识地理环境与公路工程的关系,难以给予明确的指导方向。本课题在此背景下提出,借助自然区划的
随着互联网的发展及广泛应用,电子邮件系统已成为人们日常联络通讯的主要工具。当前电子邮件系统面临着机密性泄漏、信息欺骗、病毒侵扰、垃圾邮件等诸多安全问题的困扰,因此关