受限领域中文情感问答系统研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:b411574103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字信息的膨胀,大量可用的数字信息对于回答用户的各种问题变成了可利用的资源。传统的信息检索通常会对用户的提问返回成百上千篇文档,而用户必须依靠自己在这些繁多而又充满重复的文档中筛选自己需要的有用信息。为了克服这些不足,近年来,越来越多的研究机构和公司致力于新一代信息检索系统的研究,其中一个很重要的方向就是问答系统。如今大多数的问答系统对于简单的事实性问题和常问问题的回答已经达到了很高的准确率,然而偏重于观点或情感的问答系统的研究却相对较少。人们不仅想要了解既定的事实,也想了解大众或他人对于某些特别的话题、人物,或者事件所持有的观点、想法和感情。我们发现人们对于焦点人物的关注度很高。人们喜欢了解焦点人物的喜好,也想要了解别人对这些公众人物是如何看待的。本文以娱乐焦点人物的喜好以及大众对其的情感作为研究对象,从比较新颖的情感角度来对问答系统进行研究。相对于事实性问答系统而言,观点或情感问答系统的研究除了需要考虑观点持有者及情感倾向性等与情感相关问题以外,其难点还在于答案形式更复杂更分散。本文从百度知道人工搜集了大量的情感问题,并根据情感问题的特征,统计并归纳了五大情感问题类型。问题分类模式与传统事实性问答系统不同,不能仅仅根据疑问词对其进行分类,还需要考虑到观点以及受众的反应。问题分类使用基于组块分析的CRF模型与规则相结合的情感问题分类方法。在答案抽取时结合组块识别的结果和情感的倾向性,并根据情感问题类型的不同采取不同的方法以获取答案。实验表明本文情感问答系统研究中所用方法是有效的。
其他文献
近些年,细分方法成为了几何造型领域最活跃的研究热点之一。随着人们在细分领域的不断开拓和研究,在细分的连续性理论、多分辨率表示、非正则规则的构造技术等方面,人们已取得了
基于支持向量机的图像检索,是一个有望用较少的图像样本,取得较好的检索效果的检索手段。借助支持向量机强大的学习能力,研究低层视觉特征和高层语义概念之间的关联,从而实现将高
火灾探测技术是火灾科学领域研究的热点,已取得不错的研究成果。传统火灾探测技术在保护人们生命和财产安全方面起到了非常重要的作用,但在大空间、室外等场所暴露出种种的不足
典型相关分析(CCA)作为经典的多元数据分析方法,通过研究两组变量之间的相关关系来进行特征提取,近年来已开始在模式识别和机器学习等多个领域得到广泛的应用。但一方面,CCA
P2P技术是目前国际计算机网络技术研究领域的一个热点,它将网络的控制权归还给了用户,让他们之间的沟通变得更容易、更直接。它使得边缘节点的资源得到了充分的利用,并能够以
在当今数据信息技术快速发展的社会,信息安全对于每个人来说越来越重要,身份验证和识别是保证安全的重要方法,受到研究人员越来越多的关注。近年来,基于生物识别方法,由于生物特征
当今世界,网络技术已经产生了质的飞跃,随着IP网络的飞速发展,网络的带宽和质量都进步良多,各种基于IP网络的应用也如雨后春笋般出现,而传统电话通信和IP网络间的融合,即Voic
近年来,基于P2P技术的各种网络应用越来越广泛,其中影响最大的应用是文件共享。P2P文件共享以BitComet、Azureus等BitTorrent(BT)类软件为代表,BT流量在整个网络流量中比例非
数字产品已经成为人们主要的信息交流方式,从Internet获得信息达到了前所未有的深度和广度,随之而来的非法复制、篡改等侵权问题越来越受到人们的关注,保护版权者及作者的利
分类算法是数据挖掘领域中很重要的数据处理方法,但传统分类算法都具有其自身的缺陷:ID3决策树构造简单,但它无法处理具有缺失属性值的数据集;C4.5决策树改善了ID3存在的问题