面向生化网络的文献挖掘方法研究与系统集成

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zmhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术的迅猛发展,生物医学信息量呈爆炸性增长。生物医学文献作为展示学术成果的主要方式之一,其数目之大、增长速度之快远远超过了其他学科领域。面对数目巨大且快速增长的文献,研究者如果仅依赖手工的方式获取文献信息,完全跟踪其研究领域几乎是不可能的,甚至是一个特定的主题也难以做到。因此,一个能自动从海量文献中找到重要信息的文献挖掘系统,成为了生物医学研究者在研究工作中必不可少的工具之一。本文以生化网络为主题,对文献挖掘中的一些关键的方法进行了研究,主要的研究工作包括:1.针对目前已出现的具有特定一项功能的众多文献挖掘工具,本文给出了一种面向生物医学文献挖掘的通用系统设计方案——BNLitMiner系统方案,并通过对一些关键算法的研究与应用集成系统的开发实现了这一系统方案。集成系统基于J2EE构架,具有较强的鲁棒性、可扩展性、可移植性。2.针对传统的贝叶斯方法在生物医学文献挖掘应用中偏向于较长文档这一不足之处,通过引入文档长度因子,提出了一种改进的贝叶斯算法(LRABIB)。实验结果与分析表明:相对于一般的贝叶斯方法,LRABIB提高了文献的查全率和查准率,同时减少了算法执行时间。3.在生物医学文献自动分类过程中将基因本体(Gene Ontology, GO)信息引入到支持向量机(Support Vector Machine,SVM)分类模型中,提出了GO-SVM算法。实验结果表明,GO-SVM算法相对于传统的SVM分类具有较高的综合指数F-Score。应用文献挖掘的方法来获取生物医学知识,不仅仅具有巨大的理论价值,还具有广阔的前景。本文针对生化网络这一主题,对文献挖掘的一些关键的方法及应用系统集成做了一些初步的研究工作,将更多现有的生物学知识引入到生物医学文献挖掘的中进一步完善现有工作是我们未来的方向。
其他文献
随着芯片集成制造工艺的日益发展,在同一芯片上集成了多个处理器的CMP架构已成为桌面应用和高端计算的主流平台。通过集成多个处理器,CMP架构提供了更多的计算资源,同一时刻可以
人脸表情识别技术是涉及情感计算、图像处理、机器视觉、运动跟踪、模式识别、生物特征识别、生理学、心理学等研究领域的一个极富挑战性的交叉课题,它是情感计算、人机智能交
传统的视觉图像系统是基于“摄像头-图像采集卡-通用PC机”三者为一体的系统。这种视觉系统不能满足嵌入式环境下对图像实时处理的需求,因此需要研制一种专用的视觉图像系统,既
视频通信是多媒体通信的重要应用之一,无论在IP网络还是在无线移动网络信道中,误码的产生、数据的丢失总是难以避免,而高压缩后的视频数据对误码非常敏感,因此如何进行错误控制以
随着IP网络通信和多媒体视频技术的快速发展,网络视频的研究和应用越来越受到广泛的重视,开始在各行各业发挥着重要的作用,网络视频质量监控也随之成为此领域内的一个热点问
分片式处理器能够很好地应对纳米工艺代芯片设计中存在的功耗、线延迟和设计复杂性问题,充分地利用日益增长的片上晶体管资源以提升应用的性能,但对其上的Cache设计提出了新的
目前,在教育教学中应用计算机已成为一种趋势。随着计算机应用的迅猛发展,网络应用范围的不断扩大,从而使得考试的技术手段和媒介也发生了革命性的变化。计算机考试系统随之
随着图像配准技术的不断成熟与完善,图像配准技术已经应用于自动目标识别、医学图像处理、智能机器人、智能制造业、军事应用等领域,并取得了大量的研究成果。而虹膜作为重要
基于构件的软件开发是软件复用领域的研究重点,被视为解决软件危机、提高软件生产率与质量、降低系统开发周期与成本、增强系统灵活性与可维护性的现实可行途径。然而,直接复
多媒体信息的大量涌现要求现代计算机必然具备卓越的多媒体处理能力,多媒体应用程序的一个最突出的特点就是其内在的并行性,要求同时对多个数据单元进行相同的规则操作,这种