面向基因的文本挖掘方法研究及其应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:sclin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来关于基因功能、基因和疾病关系的生物医学文献大量涌现,但因其数量之多、涉及范围之广,很难靠人力完成全部的阅读来发现其中丰富的生物学知识。同时,从事基因疾病课题的研究人员,要通过大量的实验和临床数据分析才能得到出课题结论或预测,研究周期长,人力物力投入大,而且每研究一种新基因或新疾病就要重复实验过程,知识发现过程缓慢。为了能够充分利用已有的研究成果,节省人力物力,需要将文本中的生物学知识抽取出来提供给研究人员,帮助他们快速了解基因或疾病,加快相关研究的进展。 我们开发的基因疾病关系数据库系统,利用生物医学文本挖掘工具,从系统自动下载的生物医学文摘中抽取基因、疾病、基因本体等信息实体及其相互关系,将这些数据存储到数据库中,把非结构化的文本数据转化为可检索的结构化数据。系统提供基因、疾病、基因本体等生物学实体关联信息的检索,以及关联信息原文原句的查询,使用户全面了解感兴趣的基因或疾病,帮助用户加速相关学科的研究。此外,系统具有可视化的串联检索功能,能够利用数据库中已有的生物学实体关系,对潜在的生物学实体关系进行深度挖掘,分析出新的生物学实体关联信息,为用户相关研究的进展提供帮助。 基因疾病关系数据库已存储了本体信息约330万条,2000-2003年基因疾病相关的文摘约10万篇,其中经过文本挖掘处理的文摘约10000篇,生物学实体关联信息约12000条,数据仍在不断增加中。经测试,系统具有良好的生物学实体关联性,能够发现潜在的基因、疾病、基因本体相互作用网络,挖掘出新的生物学实体关系,辅助形成生物科学研究创新假设。
其他文献
学位
学位
9月27日,在喜迎新中国成立70周年之际,中共黑龙江省委史志研究室召开庆祝新中国成立70周年暨机关党员大会.省委史志研究室主任何伟志出席会议,并作题为《礼赞新中国,奋进新时
期刊
当今的社会环境下,企业难以脱离开政府、市场、机构和客户等而独立存在,并且为了获得利润、优化资源配置,需要从市场上输入必要的资源,而后再将其产品输出到市场上.从更深层
学位
学位
区域间的旅游线路规划对当地的旅游业发展尤为重要,规划合理的旅游线路可以为游客带来舒适的旅游体验.黑龙江省作为旅游资源大省,规划合理的旅游线路有助于提高旅游资源的利
在商品与服务逐渐同质化的过程中,越来越多的商家开始通过体验式营销吸引消费者的目光.通过正确的视觉语言设计出符合消费者审美标准的品牌视觉形象能吸引消费者更多的关注度
目的:  烟碱型乙酰胆碱受体(nAChRs)是一类由五个亚基组成的五聚体配体门控离子通道蛋白质,它们广泛分布于中枢神经系统及外周神经系统,能够和神经递质乙酰胆碱分子结合,在神经信
学位