问答系统中词义消歧与关键词扩展研究

来源 :太原理工大学 | 被引量 : 4次 | 上传用户:longlong2ddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是信息检索系统的一种高级形式。它与传统搜索引擎不同,它允许用户用自然语言进行提问,并给用户返回确切的答案,而不是返回一系列相关链接。随着自然语言处理的研究,问答系统进入新的阶段。问答系统主要包括问句分析、信息检索和答案生成。问句分析包括分词、词性标注、词义消歧、关键词扩展等。分词和词性标注目前已有一些比较成熟的方法。词义消歧是问句分析中的核心问题,在机器翻译、信息检索等众多领域有着重大的作用。在信息检索领域,词义消歧能为后续的搜索提供依据,使搜索引擎充分理解用户具体的需要,从而进行精确查找。关键词扩展是有待解决的问题。互联网上的海量的信息,在提供资源的同时也给用户查找资源带来了困难,由于自然语言中存在大量的同义词、近义词,用户检索时一般不会列举出全部表示同一概念的不同词汇,因而在检索时容易造成漏检,扩展查询方法能在一定程度上提高搜索的查全率和准确率。本文针对问句分析中的词义消歧和同义词扩展展开研究。主要工作如下:首先,论述了中文信息处理中常用的语义资源、分词方法、词语相似度计算方法、词义消歧方法,重点分析了并实现了基于《知网》的词语相似度方法及句子相似度方法,使用了基于《知网》的句子相似度算法来解决词义消歧的问题,并通过实验验证了方法的有效性。其次为了使用户能快速找到所需要的信息,提高传统检索系统的查准率变得很重要。本文以初始查询语句为基础,同时使用《同义词词林》和《知网》两种语义资源进行同义词扩展查询方法,最后通过实验验证了方法的可行性。
其他文献
目前,数据挖掘技术越来越为人们所重视。而分类是数据挖掘领域当中一个非常重要的问题,聚类算法和支持向量机在处理分类问题上都表现地非常的出色,成了当今数据分类的两种十分有
在药物研发过程中,需要通过从海量化合物数据库中筛选出质量较高的药物先导物来实现药物设计成功效率的增加,因此,类药性的概念应运而生,药化学家们通过这一概念对分子结构特征和性质进行研究,并总结出了类药性预测指标。另外,化合物的构造活性关系研究也是药物设计的重要方式之一,在发现和研究新的药物的过程中,研究化合物活性与研究化合物类药性同样重要。在大多传统的化合物活性研究中,通过动物活体测验和检测方式对化合
近年来,随着计算机信息化进程的发展,越来越多的视频设备以及技术应用到人们的学习以及日常生活中。视频会议、视频搜索引擎技术以及视频数据查询等等技术的应用,在包括电影
无线传感器网络覆盖协议是无线传感器研究领域的一个重要内容,节点密集部署,会造成过多的能量消耗和大量的数据冗余,覆盖控制可以使无线传感器网络的空间资源得到优化分配,更
车载网络系统已广泛运用于汽车行业,它替换了传统庞大的布线系统。CAN总线是使用最广泛的网络标准之一,它支持分布式实时控制并具备高性能与高可靠性的特点。然而伴随着汽车
基于内容的图像检索就是指在用户给定查询图像的条件下,根据图像的内容从大规模的图像库中搜索出与查询图像一致或相似的图像,但是图像低层视觉特征和高层语义之间的“语义鸿
在以往的维吾尔文全文检索系统中,由于维吾尔文本身构词方式及形态的灵活多样性,不可避免地需要进行词干切分,并以词干作为索引项建立索引,然而切分工具本身的不足和局限性,
管道机器人是在特殊环境下为人类提供服务的一种智能化设备,随着管道检测技术的发展和应用,在役管道的维护需求为管道机器人的研究和应用提供了广阔的发展空间,这领域的研究
阴影是增强计算机虚拟现实的一种重要技术,阴影特效是3D游戏,军事仿真领域不可或缺的一部分。在3D场景中添加阴影,可以使场景更加逼真生动。高质量的阴影效果,不仅可以让虚拟
网格为科学研究和工程应用中的大规模问题求解提供了一种理想的计算平台。网格资源的异构、分布、动态及自治特点,使得资源管理问题充满挑战。网格资源管理方法和技术研究成