站内搜索系统动态摘要算法的研究

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:simon20088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对搜索系统中的几种摘要算法进行了介绍,分析了lucene软件包中的动态摘要算法存在的问题,即没有充分考虑关键词在整篇文章中的重要性。然后提出了改进后的算法,考虑了关键词出现在文章的位置,上下文等相关因素。改进后的算法充分考虑了文档摘要的要求:一是能表达文档的主旨;二是“可读性”比较高。经测试改进后的算法生成文摘质量较好。
其他文献
依据生物免疫的防御层次结构,分析了网络入侵的多层防御体系。引入生物学中残余抗原理论,结合入侵检测过程中存在的残余抗原,提出了一种新的基于残余抗原理论的动态记忆算法。在
建立网络医药全文信息资源库对深层次开发网上医药信息资源具有重要的意义;介绍了以人工辅助为主要手段的建库程序:确定信息采集的学科专业范围与建库模式--选择相关网站,浏
本文通过对合并专升本高校图书馆专业队伍现状和问题的分析,从建设适应学校发展需要的图书馆人力资源、完善管理机制、建立和完善激励机制、重视发挥女馆员的积极作用等方面