【摘 要】
:
生物大分子的亚细胞位置预测工作一直是生物信息学领域的热门话题。蛋白质以及RNA的亚细胞位置定位研究进展一直是领域内的关注热点。近几年的众多研究表明了解RNA和蛋白质的
论文部分内容阅读
生物大分子的亚细胞位置预测工作一直是生物信息学领域的热门话题。蛋白质以及RNA的亚细胞位置定位研究进展一直是领域内的关注热点。近几年的众多研究表明了解RNA和蛋白质的亚细胞定位信息对于理解RNA和蛋白质的功能,RNA之间的相互作用,蛋白质之间的相互作用,RNA与蛋白质之间的相互作用,药物的靶向治疗都具有重要的意义。由于通过生物实验测定RNA以及蛋白质这些生物大分子的亚细胞位置需要消耗大量的成本与时间,因此基于计算方法来预测生物大分子的亚细胞的定位信息是一件十分急切并且有意义的工作。本文的工作主要涉及长链非编码RNA(lncRNA)和植物蛋白质的亚细胞位置预测工作。在第一个工作中我们在领域内首次提出了针对lncRNAs序列的亚细胞位置预测算法。在第二个工作中我们结合基因本体论特征和保守结构域特征提出了Plant-mPLoc3.0预测算法,优化了此前对于植物蛋白质的亚细胞位置预测工作。本文的主要贡献总结如下:(1)收集整理了长链非编码RNAs的亚细胞定位数据集。(2)基于栈式自编码器挖掘原始序列特征中的高级抽象特征。(3)基于有监督的上采样算法来缓解数据集分布中存在的不平衡性。(4)利用一个全连接的深度神经网络(DNN)来对不同分类器的整合方式进行建模。(5)搭建了长链非编码RNAs的预测网站。(6)探索了词向量编码在RNA亚细胞位置预测方面的应用。(7)收集整理了植物蛋白质亚细胞定位数据集。(8)构建了一个全物种的基因本体论特征相似性矩阵和植物蛋白质保守结构域特征相似性矩阵来预测植物蛋白质亚细胞位置。(9)挖掘类标之间的相关性并且基于动态阈值准则优化预测结果。(10)搭建了植物蛋白质的亚细胞位置预测网站和本地运行软件。
其他文献
中国在21世纪经济开始逐渐表现出新常态的基本特征,经济转型的趋势更加明显。为使我国经济转型能够更顺利地进行,李克强总理在有关会议当中明确指出要进行经济创新转型。目前,转型的基本理念已经在许多领域当中得到了深入的贯彻,用户等人群开展各种用户创新活动。协同以及开放创新等都对大众创新创业整体的发展起到了十分重要的推动作用。然而,目前虽然有“大众创业、万众创新”等思想的引导,但是目前国内仍然没有建立起相应
由边坡失稳造成的滑坡灾害是我国的主要地质灾害之一。传统的边坡稳定确定性分析方法无法考虑边坡工程中的不确定性因素,如土体参数和计算模型的不确定性。相对而言,边坡稳定
随着世界一体化的发展,我国对外贸易经济日益开放,国际金融危机频发,对我国国民经济造成冲击,所以度量金融市场风险尤为重要.Copula理论可以度量随机变量之间非线性的相关关
二十一世纪以来,随着机器视觉和图像处理技术研究的不断深入,三维扫描技术取得了巨大进步。其中结构光投影测量技术作为三维扫描技术的核心组成部分,凭借其非接触、高效率、
随着我国经济的快速发展,石油、煤化工以及天然气工业开发产生的H2S、CO2等酸性气体也逐渐增加。产生的这些酸气不仅会腐蚀设备,还会污染环境并威胁人身安全。我国目前主要采
海上气田开发中,常采用气液混输(湿气)管道输送采出气,以降低生产成本。但湿天然气中CO2溶于水,易导致管道内腐蚀失效,严重影响湿气管道安全高效运行。因此,有必要深入研究海底
随着人工智能与模式识别领域的不断进步与发展,人脸识别技术已经得到了广泛应用。视频单样本人脸识别是人脸识别技术中的一种典型应用,是指在视频序列中利用仅有的单张人脸样
相对于传统光学成像与测量技术来说,偏振成像与偏振测量技术是一种新型的光学探测技术,该技术将偏振测量与图像处理相结合,通过测量物体光波的偏振态(Stokes矢量)或目标对偏
微波液相放电技术是一种新兴的等离子体发生技术,因为在放电过程中会产生许多自由基,如OH·自由基、H·自由基、O·自由基等,所以目前对其研究方向也有所不同,可以将其应用到不同领域,如水处理的高级氧化、纳米材料的制备、以及碳氢化合物制氢等等应用方向。本实验中使用的微波液相放电系统的有效放电取决于电极和系统之间的匹配程度,以及电极寿命的长度。所以制作一个有效的反应电极是实验的重中之重,本实验中通过采用新
二手车由于价格的优势,发展的势头越来越好。由于互联网技术的发展,二手车与互联网联合起来,使得二手车市场的交易变得更加广泛。但是二手汽车电商行业的起步比较晚,仍然需要