基于生物信息学的蛋白质-适配体预测及适配体判定研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:fsb820101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核酸适配体(简称适配体)是与靶标具有高亲和力的、长度大约在30 nt-80 nt的核苷酸链。与普通的DNA/RNA相比,适配体具有易合成,高亲和力和特异性等优点。蛋白质是生物体细胞的重要组成成分,更是生命活动的主要承担者。适配体与靶标蛋白质的相互作用在人体中广泛存在,并在各类生命活动中发挥着重要作用。快速且准确地预测蛋白质-适配体相互作用,有助于预测蛋白质功能和从分子水平探讨人类复杂疾病的发病机制,为疾病的诊断、治疗和相关药物开发提供重要的理论支持。目前,以蛋白质为靶标的适配体预测研究是与蛋白质相关的基础和应用研究领域中的一个热点。通过传统的实验方法确定蛋白质-适配体具有相互作用,实验周期长,费用高且无法大规模开展。随着高通量测序技术飞速发展,被测定的蛋白质序列数据呈几何级数增长,实验方法的弊端就尤为突出,亟需开发基于生物信息学的计算方法,高效、准确地预测蛋白质-适配体相互作用和判定适配体。本文用生物信息学的方法对上述两个问题进行研究并提出了解决方案。在数据集处理,特征空间构建以及算法的选择与改进上进行了优化,实现了性能更好的蛋白质-适配体预测模型与适配体判定模型。并设计实现了PPAI在线服务平台提供信息查询和以上这两种功能。第一,在深入分析现有的蛋白质-适配体相互作用预测方法的基础上,本文采用生物信息学方法,对预测蛋白质-适配体相互作用中存在的一系列问题进行了优化和设计。在预测前,采用SMOTE算法对不平衡的数据集进行了数据平衡预处理。通过深入分析蛋白质与适配体的序列和结构特点,选取了与理化性质相关的一系列关键特征,提出一个基于多重特征和机器学习的蛋白质-适配体相互作用预测模型。在该模型中,首次提出Adaboost方法和随机森林方法相结合的预测算法。将本文模型与其它蛋白质-适配体相互作用预测模型进行比较,实验结果表明,本文所提模型在预测准确率和算法复杂度方面均优于现有模型。第二,首先对常用于适配体判定的机器学习方法进行了深入研究,发现存在准确率较低、判定阈值难以调整等缺陷。本文在充分分析核酸序列二级结构特征的基础上,首次将用于蛋白质-适配体相互作用预测的Adaboost方法和随机森林方法相结合的算法应用于适配体判定。最终实验结果表明,本文所提方法比其他常用机器学习方法具有更高的预测准确率、更加易于调整判定阈值。为了方便研究人员对以蛋白质为靶标的适配体进行深入地研究,本文设计并实现了蛋白质-适配体相互作用预测的在线服务平台——PPAI(http://39.96.85.9/PPAI),为用户提供高效、准确地预测蛋白质-适配体相互作用和判定适配体的功能。此外,该平台还提供了蛋白质-适配体信息查询功能,方便研究者了解蛋白质、适配体的相关信息。
其他文献
人口老龄化加重已成为中国乃至世界所面临的一个社会性问题,而中老年人的日常护理和疾病防治是繁复且必要的医护工作。根据呼吸系统方面的主要病因和卧床瘫痪的护理需求,设计了一种面向辅助翻身的柔性护理床垫。该床垫以气囊为关键受力件,结合柔性压敏传感器达到在睡眠中监测呼吸状态的同时通过调整节气囊高度进行睡姿调整的功能,并且能够通过身体各部位气囊压力和高度的调节辅助翻身防止卧床产生褥疮等。但是该种用于护理床上的
表面肌电信号记录了肌肉的电信号,是在体表无创检测肌肉活动的重要方法,常用于智能假肢控制、康复训练和评估,以及人机交互等领域。如今,肌电采集系统存在处理时间长、存储容量不够和功耗高的问题,因此,基于压缩感知的表面肌电信号采集与重构的研究,对于降低肌电采集系统的功耗,解决数据传输带宽限制,节省数据存储内存,提高肌电信号检测的准确性和实用性等具有十分重要的意义。本文针对表面肌电信号处理时间长和存储信息量
以氧化石墨烯(GO)为代表的二维纳米材料在分离膜中发挥着重要作用。在GO膜的制备中,多孔支撑层用来提供足够的机械支撑,不同物理和化学性质的支撑层影响着GO膜的组装结构和性能。目前支撑层对GO膜性能影响的研究较少。本论文以聚醚砜(PES)超滤膜为基膜,选用不同的纳米材料为中间层,考察了支撑层形貌对复合膜的结构和性能的影响。通过聚多巴胺(PDA)对PES超滤膜改性后压力沉积不同量的二氧化钛(TiO2)
实施创新驱动发展战略,要求企业不断提高自主创新能力,掌握并运用好系统化创新方法是保障企业核心竞争力的有效途径之一。TRIZ提供了发明问题解决工具和方法,能够迅速帮助设计者获得满意的创新方案,是解决各类复杂技术问题的有效手段。但TRIZ在科学有效的定义冲突方面还存在不足之处,且TRIZ本身并未提供可靠的方案评价依据。为了弥补TRIZ理论的不足,论文将引入TOC理论中的思维流程工具与TRIZ工具结合,
随着全球生态环境的日益恶化和能源的紧缺,电动汽车的需求量正不断增多。我国目前正在大力推进纯电动汽车的发展,永磁同步电机以其结构简单、较高的功率密度和峰值效率被广泛的应用于纯电动汽车上。纯电动汽车动力源由内燃机变为电动机,因此它的背景噪声更低,使得电机噪声对整车的贡献更加突出。消费者在购车时越来越注重乘坐舒适性,驱动电机产生的噪声会使人产生不悦的感觉,所以市场和企业都对电动汽车驱动电机NVH(Noi
电解质水溶液的微观结构和宏观性质之间存在着密切的联系。物质的磁效应提供了物质结构、物质内部各种相互作用以及由此引起的各种物理性能相互联系的丰富信息,研究强磁场对水溶液微观结构及其宏观性质的影响,可以揭示水溶液结构受强磁场影响的本质及变化规律,进而为水溶液的宏观性质和微观结构的联系研究提供一定的理论依据。本文利用X射线衍射法、拉曼光谱法、紫外光谱法、接触角测量法、粘度测量法和分子模拟研究了不同强磁场
随着互联网技术的飞速发展和电子商务的不断完善,越来越多的用户开始在电商平台上分享自己对产品的评论和看法,由此产生了海量的产品评论文本,对这些产品评论数据进行情感分类含有很高的商业价值和研究意义。但是,不同语言的情感资源在质量和数量上分布不均匀,无法更好地对情感资源不足的语言进行情感分类,而很多小语种仍然有着进行情感分类的需求和研究意义。因此,研究者借助于英语等语言的标注数据和情感资源帮助其他资源匮
在应用链拖动的装备中,振摆现象常有发生,这会对设备的重复定位精度、运行状态、使用寿命等造成影响。然而,由于链拖动的摆动中心不固定,使得这种振摆过程的检测很难通过安装固定的传感器来实现,迫切需要一种稳定、高效且精度较高的检测方法。本文以某型号自动输送平台的环形链拖动输送系统作为研究对象,开发了一种链拖动振摆动态检测系统,解决了生产中的困难问题。本文主要研究内容如下:视觉检测系统的搭建。通过对设备中链
随着海洋工程事业的大力发展,自主水下机器人(Autonomous Underwater Vehicle,AUV)越来越引起人们的重视。在海底地形测绘、资源勘探以及海洋防卫等领域都存在着AUV的身影,其原因在于AUV具有灵活、运动范围广等特点。但是海洋环境极其复杂,存在着海沟、海底陡坡以及岛屿等不确定性的障碍物,因此AUV在执行航行任务的过程中也存在着巨大的风险。针对水下未知环境中的AUV自主避障问
在可再生能源中,风能作为化石能源的替代能源,被认为是最有前途的能源之一。然而,由于风力存在明显的间歇性、不确定性,风力发电机组输出功率不稳定,给电力系统的稳定运行带来严峻挑战。高精度的风速和风电功率预测,在并网计划、安全效益、检修安排等方面具有重要意义,同时传输系统运营商将更容易进行实时调度。本文依据华北某风电场SCADA历史数据对风速及功率预测展开研究。针对风速具有强非线性的特点,提出了一种奇异