【摘 要】
:
随着互联网技术的不断发展和应用的不断深入,在线可用的信息呈爆炸式增长。当在线的信息持续增长时,现有的搜索引擎的不足,比如系统返回用户的文档太多;用户需要花费时间和精
论文部分内容阅读
随着互联网技术的不断发展和应用的不断深入,在线可用的信息呈爆炸式增长。当在线的信息持续增长时,现有的搜索引擎的不足,比如系统返回用户的文档太多;用户需要花费时间和精力寻找自己需要的信息;同时对用户的使用水平也有要求,就越来越明显。本文提出设计和实现一个基于多个搜索引擎的开放领域的问答系统框架。本系统接受用户以自然语言形式描述的提问,并能返回用户该提问准确和简洁的答案。
根据D.Moldovan的研究,由于问题理解部分处理不当导致错误占78.1%。在问题理解部分,考虑到每种技术都有自身的准确度和问题类型的涌盖范围的问题,对于事实类和定义类问题,本系统采用一种简单的通过命名实体确定答案类型的方法和一种成熟的模式识别方法相结合。因为第一种方法的精度高,首先使用第一种方法对问题进行处理。但是,当答案类型不能被决定或不能被命名实体标签时就会失效。在这种情况下系统自动调用第二种通过文本模式识别方法对问题进行分类和解析。同时,系统还增加了反馈机制和后备技术,在无法找到合适答案时,通过调整查询来开始新一轮的处理过程,反复迭代。在信息检索部分,系统基于元搜索引擎的技术和结构化文档搜索相结合的方法使得搜索范围更广。
最后对不同领域问题,不同疑问词问题与无疑问词问题以及系统整体性能进行了评测。系统的精确度为53%,平均排序倒数为36%,精确度已经达到了50%以上,已经达到了目前QA系统的基本水平,证明其结果能够满足用户的基本需求。
其他文献
目前,P2P技术已经成为近年来互联网最热门的技术之一,它具有对等性高、健壮性好、负载均衡等优点,得到了广泛应用。但是,目前P2P的应用还存在一些问题,如P2P带宽滥用,P2P网络蠕虫传
进入21世纪以来,互联网的快速发展以及带宽的提升使得通过互联网获取各种对带宽要求较高的多媒体服务提供了可能。以往的单播方案,采取C/S模型,在特定的服务器和每位用户之间
本课题主要研究多媒体教学场景中的跟踪问题,以场景中授课教师为跟踪目标,要求实时录制教师授课情况。基于特定的应用场景,课题在单目标、单摄像头,且目标和摄像头都运动的情
随着信息化时代的不断推进,人们对信息化技术的依赖逐渐变大,游客的个性化需求增多,也更倾向于选择去信息化建设完善、能尽量满足他们个性化需求的景区。因此,为了增加景区的
随着互联网的发展,网络信息呈爆炸式的增长,如何快速有效的获取网络信息已成为一个重要的研究问题。文本摘要和关键词抽取技术正是在这样的一个背景下发展起来的,随着信息检
随着互联网的快速发展,网络媒体应运而生,传统媒体公司也随之建立了新闻发布网站。网络传播的快捷性、互动性、开放性等特点使得民众可以快速关注网络上的热点事件,发表看法
程序理解是软件维护的重要阶段,程序员对程序的理解程度直接影响到维护工作的正确性和效率。由于在设计程序时,尤其是使用面向对象方法设计时,功能行为相关的代码通常会被分散在
随着计算机视觉技术的不断发展,立体视觉被广泛应用于虚拟现实、机器人导航、工业检测等领域。立体匹配是立体视觉中的关键技术之一,对立体视觉的发展具有举足轻重的作用,本文针
协同式专家系统是指能综合若干个相近领域或一个领域多个方面知识的多专家系统。电站新建机组调试需要多个专业有多年实际调试经验的领域专家协作完成,将协同式专家系统应用到
图像处理和图像通信是信号处理和现代通信的重要组成部分,与人们的关系日益密切。图像去噪是数字图像处理的一个重要研究方向,是对图像进行后续利用的基础,而数学在图像处理