基于常问问题集的金融自动问答系统的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:henan8810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融业在中国的快速发展,社会对金融领域的信息需求日益扩大。国民迫切需要一个能够针对金融领域答疑解惑的工具。然而问答系统研究长期以来主要关注的事实类问题只占现实生活中人们所提出的问题的一小部分,远远不能满足社会对问答系统所期望的全部信息需求。因此,大量的在线网友问答平台和FAQ(Frequently asked questions)服务涌现出来。许多需要经验、预测或需要根据现实背景才能解答的问题让计算机来自动解答还为时过早,却可以从这些网络资源中找到现成的答案。与此同时,在TREC评测对特定领域搜索和问答技术的推动下,特定领域问答系统的研究和应用逐渐成为热点。  利用在线网友问答平台中的庞大资源,本课题实现了一个面向金融领域的自动问答系统,主要用来查找并返回现有问题列表中与用户所提问题语义最相近的问题答案对。课题的研究工作主要包括:总结FAQ和在线问答系统这些真实环境中问句出现的特殊现象和复杂现象,提出了去除问题噪音和简化复杂问句的预处理方法;针对非事实类问句的类型定义和自动识别方法、特征提取、和类别分布差异对分类效果的影响等方面进行了实验分析,问句分类开放测试最高准确率达到96.2%;结合专业领域的特点,在对比研究现有各种方法的基础上,提出了一种新的问题相似度计算方法,并达到了实用的效果。  本系统的研究成果和采用的技术对于限定领域的基于FAQ的问答系统具有广泛的通用性。
其他文献
语言模型在语音识别中占据着重要的地位,它担负着把拼音转化成汉字的重任,语言模型性能的好坏直接影响到语音识别的结果好坏。当前应用最广泛的语言模型是基于统计的语言模型
随着微电子技术和计算机软硬件技术的发展,嵌入式系统的性能得到了极大的提高,功能日益丰富,应用也越来越广泛。传统的边界防火墙是保障网络安全的重要手段,但是它存在防外不
XML以其扩展性、结构性、平台独立性和自描述性等特性成为数据表示和交换的事实标准,越来越多的应用使用XML来存储、交换和发布信息。能否有效地存储和查询XML文档,成为一个非
企业的成功日益依赖恰当的人在恰当的时间及时地获得对企业决策至关重要的信息,获得这样的信息直接依赖于数据库的性能。而数据库的性能与数据库结构有着直接的关系,良好设计的
投资者在进行交易前需要做很多的工作,那就是投资的研究和分析。要进行投资研究和分析,首先需要获取市场交易数据,没有数据就无法进行研究和分析。本文的主要目的就是为实时交易
近年来,网络和移动通讯技术的迅猛发展使视频编码的目标从传统的面向存储转变为面向网络传输。可伸缩视频编码能够使生成的码流具备空域、时域以及质量可伸缩性,从而能够在时
随着数字化技术的不断应用,数字图像的数量不断增长,如何对其进行组织、存储、表达、查询和检索是急需解决的一个问题。基于内容的图像检索技术为解决这个问题提供了一种有益
自从Internet普及以来,越来越多的人通过Internet处理各种事务。但是随之而来的是猖獗的计算机病毒和非法入侵事件,尤其在当今以网络为主的信息时代,在明处抵挡外来攻击的防
室内移动机器人将成为未来数字化家庭和服务领域的重要一员,它不但能自主地完成清扫房间、照顾老人等家务,而且还能实现看家护院、教育与娱乐孩子、超市购物和博物馆导游等功能
在求解现实中的多目标优化问题(Multi-objectiveOptimizationPloblems, MOP)时,由于采用随机式、群体式以及智能式的搜索,多目标进化算法(Multi-objectiveEvolutionaryAlgorihm