基于近红外光谱的堆叠极限学习机算法及其应用研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:redpig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极限学习机算法(ELM)有建模速度快,泛化能力强等优点,但在处理高维小样本的近红外光谱数据时,出现了样本成分含量预测结果不稳定、误差大等问题,本文针对近红外光谱的特点,对ELM算法应用堆叠策略,提出了堆叠极限学习机算法(stacked Extreme learning machines,SELM),并完成了基于SELM的中药过程分析系统原型的开发。本文主要工作如下:提出一种用于处理近红外光谱等高维小样本数据的堆叠极限学习机算法。近红外光谱数据样本量少、维度高,ELM在建模过程中遇到由于处理扁平矩阵而导致的建成的模型预测精度降低,稳定性差等问题。在SELM算法中,光谱数据的列属性被分为若干子段,每个子段都进行独立的ELM模型训练,然后对所有的子段模型进行加权集成,得到最终的SELM模型。集成过程中的权值是与各个子模型的均方根误差有关的,误差越大,其权值越小。给出了 SELM与ELM、PLS、SPLS等算法在公开近红外光谱数据集的样本成分分析结果。用公开的近红外光谱数据集验证SELM算法预测结果的良好的准确性,其中近红外光谱数据分段段数及每个分段的ELM模型中隐含结点的个数通过交叉验证的方法确定,提高了模型的稳定性。公开数据集用到了药片、啤酒、饼干三个数据集,其中饼干有四个目标理化指标:脂肪、蔗糖、面粉、水分。通过这三个数据集证明了 SELM算法的预测准确度较ELM、PLS、SPLS算法有显著提高。设计实现了一个基于SELM的中药提取过程分析软件的原型。该软件包括SELM数据预处理,参数设定,数据结果保存等流程和功能,并展示了此软件原型对中药提取过程分析的结果。其中中药数据是通过对包含四种药材(柴胡,延胡索,白芍,炙甘草)的混合物进行多批次煎煮、提取,并检测提取物中芍药甘成分浓度所得到的结果。用前六个批次的数据进行SELM建模,预测第七个批次的中药中芍药甘成分的含量,得到了较ELM,PLS,SPLS都高的准确性。
其他文献
2020年初,新冠肺炎疫情在我国武汉爆发并迅速蔓延至全国。疫情期间,线下健身房与户外运动发展严重受阻,但却极大刺激了“云健身”的普及与推广。在这个过程中,诸多类型的健身APP成为帮助人们实现“云健身”的首要工具。在疫情期间健身APP的使用成为常态,无论是线上健身培训、课程直播、线上赛事还是其他体育产业的发展都得到了大众的普遍欢迎。与此同时,近年来网络信息技术的快速发展和移动智能屏的大规模普及,让越
学位
近些年,生物特征识别技术在个人身份验证领域取得了研究者广泛关注,尤其在人脸识别、指纹识别等方面取得了显著成果。但是人脸及指纹作为外部生物特征,容易被人所伪造,而手部
在科技技术高速发展的今天,设备管理对于企业的安全及生产都是至关重要的一个环节。一个良好的设备管理系统的应用,对企业及我国经济发展都有着重要的意义。所以设备管理系统
伴随着科学技术的进步,现代社会的自动化程度越来越高,各行各业都拥有各式各样的工业设备以提高生产效率,而现在的设备在功能越来越完善的同时结构也越来越复杂,根据可靠性的
本文首先综述了无线传感器网络的体系结构、特性以及无线传感器网络技术的国内外研究现状。根据不同的分类准则,分别介绍了基于测距技术定位和无需测距技术定位算法、分布式
高分辨率图像含有较多的高频信息,可保证目标识别、图像检索等技术的准确率。目前,基于学习的超分辨率技术应用领域最广且重建效果最好。因此本文采用此方法中的基于稀疏表示
近几年来奥运会竞技项目的变化、竞赛规程的变化,影响到了全世界竞技体育的发展和变化,我国以奥运会作为最高层次的竞技发展战略也因此做出了调整和改变。皮划艇项目是奥运会
成像设备在拍摄成像时,易受被摄对象或拍摄环境等因素影响,而在最终成像中出现复杂的可变模糊。在大多数情况下,我们不仅不具备重新拍摄清晰图像的条件,而且也无法提前获知可
无线传感网络,也叫无线传感器网络,它类似于小规模互联网,是一种由大量具有无线通信能力的小型或者微型传感器自组织构成的互连网络。无线传感网络作为当今信息领域新的研究
教师承担着培养社会主义接班人、提高民族素质的使命,教师职业神圣不可亵渎。近年来我国逐渐重视教师队伍的发展,因为教育教学的质量和人才的培养都和人民教师队伍的建设和评