论文部分内容阅读
随着Internet的广泛应用,网络教育越来越受到人们的重视。由于网络教育中教师和学生在空间上是分离的,沟通与交流就显得尤为重要。因此,答疑系统成为网络教学中的重要组成部分。但是目前网络教学系统主要采用电子邮件、在线讨论和关键字查询三种方式进行答疑,效果均不理想,造成教师资源和答案资源的巨大浪费。
针对上述问题,本文结合分词技术、特征词提取方法、句子相似度测量、.知网应用技术、信息检索模型及评价等相关理论与技术,建立了一个限定领域内基于网络的自动问答系统模型,实现了一个面向计算机教学的问答系统。该系统能够自动理解学生使用自然语言提出的问题,在知识库中查找类似的问题,根据查找结果返回或即时抽取问题相关答案。
本文详细阐述了系统中几个主要部分的设计及实现过程。在问题理解阶段提出并实现了问题分类算法、改进了关键词权重的计算方法。由于关键词权重计算公式的设计考虑了词性、词长、频率等因素,使得其计算更为合理,进而提高了系统问题回答的准确率。FAQ模块主要采用改进的句子相似度计算方法来实现对学生问句的回答,该模块主要用于实现常问问题的快速、准确解答。FAQ库问句匹配算法、引进了关键词权重因子,并将其用于FAQ库问句匹配计算,使得系统计算得到的相似度更具有合理性,查准率有较大提高。系统设计的FAQ库自动更新算法使FAQ库得到及时的更新和有效的维护。信息检索模块中引入索引技术,采用倒排索引方式对文档库建立索引,其检索结果可应用在答案自动抽取阶段。答案侯选句算法能够有效地将最可能成为答案的句子筛选出来,保证了问题回答的正确率。
本文同时给出了系统实验条件及系统评价,实验结果表明,相对于传统的问答系统,本系统通过问题分类后较大地提高了系统回答问题的正确率。本文最后总结并指出基于网络的问答系统具有广阔的研究前景和实用价值。