基于文本的基因间相互关系挖掘系统研究与实现

被引量 : 0次 | 上传用户:maailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着生物学医学研究中的高通量实验方法的使用和人类等物种基因组的测序工作的相继完成,与之俱来的是海量的生物信息以及广阔的的生物学医学研究前景。目前最大的生物学医学文献数据库PubMed中收录的文献数量已经达到了前所未有的海量程度,如何帮助生物学医学研究人员从繁重的文献阅读工作中解脱出来,利用先进的文本挖掘技术辅助生物学医学研究人员去发现文献内各种生物学关系是本文的研究目的。生物学医学文本挖掘的研究以生物学医学文献为主要对象,利用信息抽取的方法挖掘其中的蕴含的生物学关系。本文从文献内基因与基因之间的相互调控关系角度出发,尝试从大量的文献中挖掘出基因与基因之间的相互关系并利用可视化的工具直观的展示它们之间的关系网络。首先,本文系统的归纳总结了现有的有关文献内基因名实体间关系挖掘系统软件和他们的挖掘方法与特点。然后,本文针对生物学医学文本挖掘的主要流程分别开展了文献内基因名实体识别和基因间相互调控关系抽取以及相互调控关系网络的可视化构建研究。在基因名实体识别的研究中使用基于词典匹配和机器学习方法相结合的识别策略,并对同义词现象做出了处理,保证了较高的识别准确率和召回率;在关系抽取的研究中,根据从生物分子事件相关语料中抽取出的相关动词与基本的基因名-动词-基因名的模式规则,成功从文本内抽取出了描述基因之间相互关系的信息。并成功通过可视化工具将结构化的调控关系信息构建出了基因间的相互调控关系网络。根据基因间相互关系挖掘的流程实现了一套挖掘文本信息与结果展示的系统,系统按照挖掘的流程被划分为几大模块,详细描述了每个模块的主要功能及流程,并简要介绍了系统的实现。分别对系统的基因名识别的召回率和准确率以及基因间相互关系抽取的性能进行了评测,基因名实体识别的整体性能令人满意但是关系抽取的性能还有较大的提升改进空间。接着系统对拟南芥、水稻、人类等物种的基因研究文献进行了挖掘实验,最后使用不同物种文献内抽取出的基因相互调控关系的结果分析了系统的运行情况。
其他文献
随着欧洲“工业革命”的出现,人类正式迈入现代化社会。人类善用科技去改善身边的自然环境,以避免来自传统意义上大自然所带来的风险;但与之相伴,科学技术为人类带来经济效益
自2005年7月21日起,我国政府将原来“紧盯美元单一货币的有管理的”浮动人民币汇率形成机制调整为以“市场供求为基础、参考一篮子货币"进行调节、有管理的浮动人民币汇率形
<正>近年来,我国GDP快速增长,但是消费需求贡献率,尤其是居民消费率明显低于国际水平,而且消费率呈现持续走低的趋势。城乡差距一直是国人普遍关注的社会问题。城乡之间的差
前置反硝化生物滤池具有良好的脱氮性能,被广泛用于污水的深度处理。采用该工艺对城市污水处理厂尾水进行深度处理,通过调节硝化液回流比(50%、100%、150%)和水力负荷(1.0、1.5
<正>神经源性膀胱是由于控制排尿功能的中枢神经系统或周围神经受到损害而引起的膀胱尿道功能障碍,是脊髓损伤(spinal cord injury,SCI)常见的合并症之一[1]。在美国,总计有
目的总结创伤失血性休克早期液体复苏的监测及护理体会。方法回顾性分析我院2014年12月至2016年1月急诊科收治的100例创伤失血性休克的救治情况,总结早期液体复苏救治和护理
通过《民用建筑热工设计规范》,在居住建筑夏季室内空调条件下,扩展了表征室内热环境参数——围护结构内表面温度的控制条件,导出了夏季不稳定传热围护结构的隔热控制参数与
在任何国家,银行业都处于金融体系的中心位置,直接影响着一个国家的经济能否高速稳健地发展,社会能否和谐有序地运行。所以,世界各国都投入了巨大的成本来加强对银行业的管理