基于最大熵模型的中文阅读理解问答系统技术研究

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户：zz5616527

【摘要】

：

阅读理解系统是自动分析给定的一篇自然语言文章,并且根据文中的信息为每个针对本篇文章的问题生成一个答案的系统。目前英语阅读理解问题回答的研究已有很多,但对中文阅读理

【作者】

：

王凯华张国华李济洪王瑞波

【机构】

：

山西大学数学科学学院,山西太原 030006

【出处】

：

第九届全国计算语言学学术会议

【发表日期】

：

2007年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

阅读理解系统是自动分析给定的一篇自然语言文章,并且根据文中的信息为每个针对本篇文章的问题生成一个答案的系统。目前英语阅读理解问题回答的研究已有很多,但对中文阅读理解问题回答技术的研究还很少.本文基于山西大学自主开发的中文阅读理解语料库CROC,根据问句和候选答案句的对应关系,抽取10个特征,采用最大熵模型对中文阅读理解问题回答进行建模。实验结果表明,在CROC测试集上的HumSent准确率达到61.5％。

其他文献

基于内容相关度和语义分析的Blog热点话题发现

目前对话题识别和话题跟踪的研究非常多,但这大都是对新闻事件进行分析,Blog是目前Internet上一种非常重要的媒体,它可以提供给用户方便地发表自己的观点并可以对其他人的观

会议

信息抽取热点话题语义分析内容相关度话题识别话题跟踪

热点事件发现

每年都会有一些机构通过媒体发布当年的热点事件,这些事件通常都是由人工进行筛选。本文提出一种方法来自动地发现热点事件。使用从新闻网站上下载下来的2006年的网页内容,通

会议

事件发现增量聚类热点事件新闻网站网页内容

基于聚类引擎的话题褒贬度计算

互联网是人们表达各种观点的重要媒介,自动获取网络上对话题的褒贬态度是自然语言处理的一项新兴课题。本文提出了利用两种搜索引擎进行话题褒贬态度计算的方法。首先,利用聚

基于贝叶斯模型的词汇情感消歧

词汇情感消歧是基于文本的情感计算的重要组成部分。本文分析了词汇情感消歧的特征,并使用自动获取和人工验证的方法确定多情感词汇。在词汇情感消歧部分共做了4个实验──基

会议

情感计算情感消歧多情感词汇贝叶斯模型词汇情感

监督学习方法在语气挖掘中的应用研究

Web语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定

基于错误预测的文本分类方法

本文提出一种基于潜在语义索引(LSI)和互信息(MI)相融合的文本分类模型。使用LSI进行特征表示和特征降维在提高分类的性能上有优异的表现,但LSI本身在处理速度和耗用空间上存

会议

基于句子特征分析和模糊推断的中文事件摘要实现机制

本文提出了基于句子特征分析和模糊推断的事件摘要实现机制。其主要思想是首先以事件新闻中的句子为单元,根据特征计算句子的权重,并且按照权重大小对句子进行排序;然后使用

会议

特征分析模糊推断中文突发事件新闻权重关联性自动生成特征计算技术分析语料库选择思想实验排序方法对句单元

利用SSR标记分析油菜菌核病抗性资源遗传多样性

为掌握油菜菌核病抗性资源遗传多样性,揭示材料的遗传背景,明确材料间的亲缘关系,从而促进抗菌核病油菜育种。本研究利用40对SSR核心引物,对汉中市农科所经过茎秆接种鉴定的

期刊

RapeseedSSRSclerotinia sclerotiorum resistant Brassica napusGenetic Diversity

γδT和Th17细胞在肝细胞癌微环境中变化的意义

目的:研究γδT和Th17细胞在肝细胞癌(HCC)组织及外周血中的表达,探讨T细胞子集在肝细胞癌(HCC)微环境中变化的意义。方法:ELISA方法检测51例HCC患者和30例正常对照组血中IL-

期刊

肝细胞癌Th17微环境IL-23γδT细胞IL-17癌旁肝组织细胞层效应细胞原发性肝癌

蒙古文扫描识别系统自动校正算法设计

本文以《蒙古文印刷体扫描识别系统》导致的文本错误为对象,观察文本中具有典型特征的各案例,并在此基础上提出了规则和相似度模型相结合的蒙古文扫描识别系统自动校正算法。

会议

蒙古文扫描识别系统自动校正相似度模型校正算法文本错误印刷体特征基础规则对象案例

基于最大熵模型的中文阅读理解问答系统技术研究

与本文相关的学术论文