论文部分内容阅读
随着科技高速发展带来的信息爆炸,周身相关的信息大幅度增加,数学建模作为信息处理的方法之一越来越凸显其重要性。但没有一种方法是万能的,不同的环境存在不同的因素干扰,为了应实际情况而选择出最佳的解决方法,需要从这些问题中寻找和提取关键的、相关的、有规律的因子,结合环境因素及之间的关联,构造出一个能反映事物的内在发展规律和过程的数学模型。本论文的研究内容和创新点如下:1、本论文首先对经济建模中的常规方法—线性回归、抛物线回归方法进行介绍,然后在上述方法的基础上引出GEP的基本描述,并对传统GEP(包含求GEP有效长度和基因表达式值的计算方法----GRCM方法)概念详细阐述。分析GEP包含的特征及特性,以及自身存在的问题-------常规的GEP算法容易陷入局部最优的误区导致算法不准确。本文将在传统GEP的有效长度基础上,并根据GEP在无效长度区域能无限查询搜索空间的特点,对演化算子进行改进,设计一种自反馈的基因表达式编程算法SGEP,最后使用真实的例子分别对改进后的GEP方法SGEP、传统GEP方法与常用的回归方程进行测试,将测试结果与传统的统计建模算法以及传统的GEP算法相比较分析,证明算法SGEP的有效性和优越性。2、提出自反馈的TIS插串算子。传统的GEP中,candida Ferreira提出了根插串、IS插串、RIS插串、变异、交叉、重组等增加基因多样性和使基因不断进化的操作方式,并根据不同的情况,设置不同的选择算子。但就插串操作而言,不同插串操作相互之间有一定的局限性,并且未能考虑到基因中的有效位长度不断减少造成种群个体的过于集中而陷入局部最优解的情况。因此,为了保证稳定的有效长度,本论文将有效位较短的基因采用从最后一个有效位对应的函数符开始插入一个有效位串(TIS串算子)的方法进行改进,以确保种群个体的均匀性和多样性,提高算法的效率。3、根据尾部无效位插入TIS串算子的方法提出一种自反馈的GEP算法(简称SGEP算法,自反馈的意思是当有效位较短时,算法会从有效位的最后一位开始往回找到一个函数符集的意思),并将此算法应用在企业的经济效益指标数据建模中;4、改进算法SGEP的实验比较分析。由于改进的SGEP算法具有比传统GEP算法更均匀的种群分布,从而能更好的避免算法陷入局部最优解,并加快了算法的收敛速度。通过使用该算法对某集团公司的5个下属企业的统计数据进行一维和多维的数据建模,并通过图表进行性能分析,说明了该算法的有效性和与传统的统计建模算法(线性回归和抛物线回归算法)以及传统的GEP算法相比具有更高的准确度,达到了较好的效果。