一种通过内容和结构查询文档数据库的方法

来源 :软件学报 | 被引量 : 0次 | 上传用户:kaizhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化文件的检索,提出了一种新的计算相似度的方法.这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节.基于这种方法实现了一个问题回答系统,测试集是微软的百科全书Encarta,通过与传统方法实验比较,证明通过这种方法检索的文章片断更合理、更有效.
其他文献
为了解决传统遗传算法易陷入局部最优解的问题,在借鉴生物学中"进化稳定策略"的基础上,对传统的遗传算法进行了改进,提出了基于进化稳定策略的遗传算法.该算法的核心在于,稳
目的比较喷他佐辛与瑞芬太尼对无痛人流术中患者呼吸功能的影响。方法60例自愿接受无痛人流术的孕妇随机分为两组,A组,喷他佐辛复合异丙酚组。B组,瑞芬太尼复合异丙酚组。比较两
目的对重症监护病房的多重耐药菌进行监测和耐药感染因素进行观察分析。方法我院确诊为呼吸道感染患者的137株菌株进行细菌鉴别,采用kb法药敏试验观察耐药率和分析可能造成感
随着网络信息的飞速增长,互联网已成为人们获取信息的重要来源.但是,受限于网络带宽,用户往往需要忍受较长的访问延时.为了缓解这种情况,人们提出了网页预取技术,用于降低用