基于生物医学本体的生物信息数据库集成方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lost123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析与处理分子生物学实验、特别是近年来涌现的高通量方法产生的海量数据是生物信息学的重要任务。大量计算机学科方法广泛地应用在这个领域中。分子生物学数据库是这两个学科的交汇点。截至2009年,国际上已经有1000个以上的生物信息数据库,这些数据库涉及分子生物学和生物信息学的各个领域,包含的数据类型复杂多样。通过分析现有数据库的内容和结构可以描绘生物信息学的发展现状以及探索新的研究方向。在这个过程中,能够挖掘数据库以及相关研究之间关系的数据库网络将是十分重要的。当前只有以研究领域对数据库的简单分类,整合并分析生物信息学数据库内容关系的研究还未在文献中见到。生物学知识固有的复杂性导致难以简单集成在已有的数据库或分子数据中。本体是一种形式化表示概念意义的描述以及概念之间关系等方面知识的方式。用唯一的标识符来标记生物学本体中的每个概念,可以用于检索分子数据库。本文整合部分现有的生物信息数据库资源,分析了生物信息数据库的一般特征和生物信息学研究的一般过程,设计了一个基于内容的生物信息数据库集成模型。本文使用概念/术语来描述每个数据库的内容,抽取生物医学本体的知识以建立概念之间的联系组成生物学概念网络,在概念网络的基础上建立生物信息数据库网络。通过进一步区分概念之间的关系类型,包括生物学关系,可以使生物信息数据库网络具有生物学意义。不同的关系赋予不同的权值,以此量化数据库间的关系,能够衡量网络中数据库之间关系的紧密程度,并基于此进行生物信息数据库检索。本文实现了一个生物信息数据库集成平台Bio-DB^2,通过整合部分现有的生物信息数据库资源,建立了基于内容的数据库网络。在实际开发中,Bio-DB^2还提供直观的关系视图来表示概念与数据库以及数据库与数据库之间的关系。
其他文献
针对目前铁路信号监测系统存在的系统开发周期长、成本高,系统性能、可靠性和稳定性降低,测试和维护工作难度增加等问题进行分析,结合目前系统的实际需要,在传统可靠性设计方
海洋是重要的能源和资源宝库,中国是一个海洋大国,更是人口大国,社会和经济发展必然越来越多地依赖海洋。为了迎接海洋21世纪,我国从国家发展战略高度出发,将“数字海洋”列
椭圆曲线密码体系是新一代的公钥密码体制,它是由N.Koblitz和V.Miller在1985年提出的。它的安全性是建立在椭圆曲线离散对数问题(ECDLP)的难解性上的。与其它的公钥密码体制(
稻纵卷叶螟是我国水稻上的一种重要迁飞性害虫。目前,我国稻纵卷叶螟测报调查方法中田间赶蛾计数法是一种常规的方法,需要一人手持竹竿拨动水稻,用肉眼扫描并计数飞起的飞蛾,其调
随着客运列车时速的增加,作为一种便捷,稳定,性价比高的交通方法,越来越多的人选择乘坐高速铁路出行。科学技术的发展也带来了移动互联网的发展,乘客要求能随时随地享受到高
在信息技术高度发展的今天,e-Learning已经成为一种新型的学习模式。纵观当前的一些学习平台,它们大多以学习对象为中心,而对教学活动的中心环节----学习过程支持甚少,这就造
在未来的WEB应用中XML将无所不在。网络安全因其在网络应用中的重要性,也因此日益成为一个不容忽视的问题。人们需要在网络中提供加解密重要信息、鉴别身份、内容过滤等重要
商业竞争日益激烈的今天,企业纷纷采用了工作流技术来提高自己的生产和服务效率,然而工作流系统中不同的业务流程之间资源的共享必然会引起一系列安全问题,安全策略在工作流
由于PDF文件格式在跨文字、跨语言、跨平台、跨媒体,跨软体方面有着卓越的表现,已逐渐成为网络电子文档交换以及归档的标准。随着PDF文件的广泛应用,它的安全问题越来越受到
据总部设在英国的鲍德咨询公司预测,尽管亚洲的金融危机仍未结束,铝市场的前景仍然看好。今年前几个月的铝消费量与去年同期相比将减少2%,但这种状况不会维持太久。鲍德公司甚至