基于概率主题模型的中草药文献服务系统的研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hyb916720hui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的互联网处于大数据爆炸的知识时代,每天都会产生各种类型、各种结构的海量数据资源等待有效利用和深层挖掘。其中文献数据是科研人员进行相关学术研究,产生新的研究成果的重要基础。尽管已有不少的文献服务系统,但如何利用先进技术提高文献检索的效率,提供更具智能、更知识化的文献分析服务仍然是当前文献系统的研发主题。本文针对中草药研究领域对文献服务的具体需求,以实际项目作为研究背景,研究和开发一个中草药文献服务系统。论文主要工作包括:1)对相关技术和方法进行调研,重点研究文献数据抓取技术、索引数据压缩和更新方法以及主题模型相关算法;2)对系统需求进行了相关分析,提出了系统总体设计方案,包括功能架构以及底层存储架构;3)重点给出系统中爬虫模块、预处理模块、搜索模块、相似文献计算模块、领域学者推荐模块以及趋势分析模块等关键模块的详细设计方案,特别提出了基于概率主题模型的文献相似度计算算法;4)完成整个系统的实现,并进行系统的性能优化。该系统已可上线运行,从而验证其系统方案的可行有效。
其他文献
近些年来电子商务不断发展,产生了很多垂直领域的电子商务,使电子商务的功能更加细分,其中国内用户对于海外电子商务购买的需求渐渐地成长起来,催生了很多相关电子商务系统,淘日网
颜色迁移(color transfer)是图像非真实感绘制和图像编辑的重要技术,既可以实现彩色图像间的颜色迁移,也可以为灰度图像着色。在计算机动画、影视编辑和图像风格化渲染中有重
随着社会的进步和信息技术的发展,特别是在“智慧城市”、“智慧地球”等理念提出后,人们越来越重视智能信息融合系统的开发。通过智能信息融合系统不仅可以达到智能监控的目
基于构件的软件工程(CBSE)由于可实现构件的复用及“即插即用”的特点,大大缩短了软件开发的周期,降低开发及维护的成本,已经成为面向对象软件工程领域的研究热点。同时,随着构件
随着计算机技术和网络技术的不断发展,各种新的媒体信息交换和应用形式已经完全融入了人们的日常工作、生活和娱乐之中,每天都在产生大量的视频数据。在医学领域同样也存在大
随着计算机技术的不断进步,掌纹识别技术已逐渐成为在模式识别、人机交互和机器学习等核心领域中的研究热点之一。掌纹识别具有侵犯性低、成本低、稳定性好等优点,已受到业界
近年来,随着信息技术和数据库技术的迅猛发展,尤其是互联网的广泛应用,需要分析和管理的数据迅速增多。数据挖掘技术便应运而生,聚类分析是数据挖掘领域的重要内容和基本工具
粗糙集理论是一种处理模糊和不确定知识的数学工具,利用已知的知识库,通过上近似算子和下近似算子来近似刻画和处理不精确的知识。它已经被广泛应用于医学、机器学习、决策分析
现在国际上的大口径兼大视场望远镜有美国的Sloan数字巡天望远镜,英澳天文台的2dF巡天望远镜,我国的LAMOST巡天望远镜等。它们将得到海量的光谱数据。通过观测获得恒星的光谱
随着科学技术日新月异的发展和软件规模的不断扩大,软件在各个行业得到了广泛的运用,已经成为生活中不可分割的组成部分。虽然软件经过严格的测试,但是每千行代码中平均仍然有10