一种自反馈基因表达式编程及其在统计建模中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:study_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技高速发展带来的信息爆炸,周身相关的信息大幅度增加,数学建模作为信息处理的方法之一越来越凸显其重要性。但没有一种方法是万能的,不同的环境存在不同的因素干扰,为了应实际情况而选择出最佳的解决方法,需要从这些问题中寻找和提取关键的、相关的、有规律的因子,结合环境因素及之间的关联,构造出一个能反映事物的内在发展规律和过程的数学模型。本论文的研究内容和创新点如下:1、本论文首先对经济建模中的常规方法—线性回归、抛物线回归方法进行介绍,然后在上述方法的基础上引出GEP的基本描述,并对传统GEP(包含求GEP有效长度和基因表达式值的计算方法----GRCM方法)概念详细阐述。分析GEP包含的特征及特性,以及自身存在的问题-------常规的GEP算法容易陷入局部最优的误区导致算法不准确。本文将在传统GEP的有效长度基础上,并根据GEP在无效长度区域能无限查询搜索空间的特点,对演化算子进行改进,设计一种自反馈的基因表达式编程算法SGEP,最后使用真实的例子分别对改进后的GEP方法SGEP、传统GEP方法与常用的回归方程进行测试,将测试结果与传统的统计建模算法以及传统的GEP算法相比较分析,证明算法SGEP的有效性和优越性。2、提出自反馈的TIS插串算子。传统的GEP中,candida Ferreira提出了根插串、IS插串、RIS插串、变异、交叉、重组等增加基因多样性和使基因不断进化的操作方式,并根据不同的情况,设置不同的选择算子。但就插串操作而言,不同插串操作相互之间有一定的局限性,并且未能考虑到基因中的有效位长度不断减少造成种群个体的过于集中而陷入局部最优解的情况。因此,为了保证稳定的有效长度,本论文将有效位较短的基因采用从最后一个有效位对应的函数符开始插入一个有效位串(TIS串算子)的方法进行改进,以确保种群个体的均匀性和多样性,提高算法的效率。3、根据尾部无效位插入TIS串算子的方法提出一种自反馈的GEP算法(简称SGEP算法,自反馈的意思是当有效位较短时,算法会从有效位的最后一位开始往回找到一个函数符集的意思),并将此算法应用在企业的经济效益指标数据建模中;4、改进算法SGEP的实验比较分析。由于改进的SGEP算法具有比传统GEP算法更均匀的种群分布,从而能更好的避免算法陷入局部最优解,并加快了算法的收敛速度。通过使用该算法对某集团公司的5个下属企业的统计数据进行一维和多维的数据建模,并通过图表进行性能分析,说明了该算法的有效性和与传统的统计建模算法(线性回归和抛物线回归算法)以及传统的GEP算法相比具有更高的准确度,达到了较好的效果。
其他文献
脱氧核糖核酸(DNA)是生命遗传信息的载体。DNA分子的完整性和稳定性对于细胞的存活和正常的生命活动具有重要意义。DNA聚合酶β(Polβ)是碱基切除修复途径中的关键酶,在维持
大型水母沙海蜇(Nemopilema nomurai)旺发已经成为近年来黄东海一个常见的生态现象。微小型浮游动物包括粒径在2-20μm之间的微型浮游动物(主要为异养微型鞭毛虫)和0-200μm的小
降水粒子的尺度大小及空间取向信息是气象探测的重要物理量。双偏振雷达的雷达参数线性退偏振比LDR及差分反射率因子Zdr是反映降水粒子的重要参数。它们可以有效的反映出降水
用00和12 UTC北京南郊观测站的探空温度廓线、相对湿度廓线、水汽密度廓线分别评价地基微波辐射计的反演精度和中尺度模式WRF (The Weather Research & Forecasting Model)的
几丁质酶广泛存在于动植物和微生物中,由结构各异的多基因家族编码。它能够降解病原真菌的细胞壁,抑制真菌的生长,具有广谱抗真菌病害功能,多年来被应用于植物抗病研究中。转
实验上研究高温高密核物质和寻找夸克胶子等离子体(QGP)的有效方法是极端相对论性重离子碰撞。本世纪初,美国布鲁海汶国家实验室(BNL)的相对论重离子对撞机(RHIC),实现了质心
超级电容器因充/放电速度快、功率密度高和循环稳定性好而备受青睐。对于超级电容器,电极材料起着尤为重要的作用。碳基多孔电极材料因具有低廉的成本、高的比表面积、良好的电子导电性和出色的化学稳定性,成为当前应用最广泛的电极材料,然而能量密度低的问题仍然限制了其进一步的发展。本论文着眼于碳基多孔材料能量密度低的问题,分别选取生物质、有机交联聚合物和聚偏二氯乙烯为碳源来制备高比电容的碳基多孔材料,同时较系统
自从夸克物质的发现以及描述其强相互作用的量子色动力学建立以来,人们很快便期待着一种新的物质形态——夸克胶子等离子体。而相对论重离子碰撞,为寻找到这种物质提供了条件
重组是同源重组介导的基因工程,通过生物体内诱导产生的同源重组酶进行,是一种高效的适用于体内遗传工程的方法,不受连接酶和限制性核酸内切酶的限制,可以在任何位点实现DNA
大偏差理论是研究破产概率的一种重要工具,该研究已成为了金融保险领域的一个关注热点.在金融保险业中,可能会发生极端事件,如地震、海啸等.由于重尾分布可以刻画大索赔,所以