PSO-RBF神经网络在DNA序列分类中的应用

来源 :吉林农业大学 | 被引量 : 1次 | 上传用户:sam_rao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
径向基(RBF)神经网络是一种典型的前馈型网络,因为其只有一个隐含层的简单构造,较快的学习速度,不容易陷入局部最小化,具有良好的泛化能力等优点在很多领域都体现出了优越性。粒子群优化算法(PSO)作为一种智能搜索算法,有较强的全局收敛能力和鲁棒性,且模型简单,没有遗传算法中的遗传操作,常被应用于RBF神经网络的参数寻优中。本文主要研究对象为PSO-RBF神经网络算法,在PSO算法改进方面选择收敛的惯性权重代替固定值,并用测试函数对改进前后算法作性能测试,结果证明该算法具有更强的局部和全局收敛能力。首次将PSO-RBF神经网络算法应用于DNA序列分类问题,构建基于PSO-RBF神经网络的DNA序列分类模型。DNA序列分类问题是生物信息学研究中重要的一部分。该研究目的是预测未知DNA序列的类别从而了解其特性,这对判断其是否属于隐存种、外来物种或者濒危物种有重要意义。特征提取是DNA序列分类非比对方法中重要的一环。本文在经典k-mers方法的基础上提出了一种新的特征提取方法:首先用碱基转移概率代替k=1、2时的单碱基和双碱基频率,其次用氨基酸种类代替k=3时的三碱基频率,最后应用主成分分析法对该特征向量降维。对比k-mers方法,该方法提取的DNA序列特征向量不仅数据维度小,且具有更强的生物学意义。最后,应用美国国家生物技术信息中心(NCBI)的真实DNA序列对该模型进行测试。测试结果显示,该模型对DNA序列的分类结果正确率达到94.90%,具有比较高的实用性。
其他文献
互联网的高速发展引起了数据的爆炸式增长,使得检索复杂度高,为解决这一难题,基于哈希的图像检索方法将高维数据映射为紧凑的二进制编码,利用检索速度较快的汉明距离做相似性
翻譯是人心互通、文明互鑒的橋梁與紐帶。當前全球疫情肆虐,中國譯者翻譯出版的《新型冠狀病毒肺炎預防手册》英文版在國際社會獲得了積極反響,對國際社會抗疫有重要價值。《
本文立足于智能工厂中安全化和绿色化的生产需求,在工业物联网的基础上结合时空感知、目标轨迹感知和移动边缘计算等技术,分别从时延敏感性和预测性的角度提出两种连续目标追
随着国产大飞机的相继研制,ARJ21支线飞机成功投入商业运营,标志着我国民用航空业近年来取得了长足发展。飞机液压管路系统作为飞机操纵能源动力的传输系统发挥着重要作用,目前民机液压膨胀环设计过程中尚未制定明确的规范,为给液压膨胀环设计与工程应用工作提供一定参考,开展本文研究工作。本文以民机液压膨胀环为研究对象,以获得其动力学、静力学、重量最优综合性能时的结构参数为目标,主要研究内容如下:(1)从振动
直接变频收发机易于集成,是目前通信系统中广泛采用的架构之一。其精简的结构对模数转换器等射频前端器件提出了更高的要求,在LTE20通信模式下,ADC的带宽要达到20MHz,精度也
K282是在Haynes282基础之上开发的一种700℃先进超超临界燃煤发电机组大型铸件用新型铸造高温合金。电站用大型高温铸件在高温下长期使用,因此优异的热稳定性是铸件长期可靠
道孚语是一种藏缅语族羌语支语言,隶属于羌语支的北组,与嘉绒语、绰斯甲语等语言有着较近的亲属关系。孔色乡位于道孚县西北部,处于道孚语分布区的西北角,受周边影响较大。本文主要以实际田野调查中所收集到的资料出发,讨论了道孚语孔色方言的动词形态及利用动词形态来辨义的一些句子。本文第一章简单介绍了本项研究的背景知识。其中第一节介绍了道孚县的概况与语言情况;第二节介绍了孔色乡的概况;第三节介绍了道孚语的概况;
桥式起重机在生产工作中有非常重要的作用,为了进一步优化设备性能,保证设备在工作期间可以安全运行,需要对设备工作期间发生的问题加以总结,分析故障出现的原因,并在此基础
随着参数化模型拟合重建思路的提出,基于单幅图像的人体模型拟合方式得到了巨大的发展空间。但是,现有的研究工作中常常忽略了相机参数误差对结果产生的影响以及稀疏骨架不同
高速串行接口(Ser Des)芯片在航天工程和武器装备中的雷达、无线电通信、影像成像等高带宽要求应用领域有着广泛的需求,已逐步成为超高速转换器数据传输的标准接口。单粒子效