基于支持向量机的近红外特征变量选择算法用于树种快速识别

来源 :分析测试学报 | 被引量 : 0次 | 上传用户:Glorygwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将稳定度自适应重加权采样特征变量选择算法用于支持向量机定性分析(Support vector machine-stability competitive adaptive reweighted sampling,SVM-SCARS)。该算法通过对数据多次采样建模计算各变量的稳定度值,稳定度值能更加客观准确地评估变量在建模中的作用,因此可作为变量重要性的评价依据。通过循环迭代方式,采用自适应重加权采样技术逐步筛选变量,然后以每次循环所得变量子集建立SVM模型,并以模型交叉验证分类正确率(Correct classification rate of cross validation,CCRCV)评估子集优劣,确定最优特征变量子集。将该算法结合漫反射近红外光谱技术建立了制浆造纸常用木材的树种识别模型,实现了对4种桉木和2种相思木的快速识别分类。最终共筛选出15个特征变量建立分类模型,模型对各树种分类的正确率达97.9%,具有较好的分类效果。与全光谱模型和递归特征消除支持向量机模型相比,SVM-SCARS能够筛选出更少的特征变量,且模型具有更好的预测性能和稳定性。研究结果表明,SVM-SCARS算法能够有效优化光谱特征变量,提高近红外在线分析模型在木材材性分析中的稳健性和适用性。 The SVM-SCARS (Support Vector Machine-stability competitive adaptive reweighted sampling, SVM-SCARS) algorithm is proposed. The algorithm calculates the stability of each variable by sampling and sampling multiple times, and the stability value can evaluate the effect of variables in the modeling more objectively and accurately, so it can be used as the evaluation basis of the importance of variables. The variables were screened by adaptive iterative weighted sampling technique through iterative iteration. Then the SVM model was built based on the subset of variables obtained in each iteration and the subset was evaluated by the model CCRCV (Correct classification rate of cross validation) The pros and cons, to determine the optimal characteristics of a subset of variables. This algorithm was combined with diffuse reflectance near infrared spectroscopy to establish the tree species identification model of common wood for pulp and paper making, and the rapid identification classification of four eucalyptus species and two species of Acacia species was realized. Finally, a total of 15 feature variables were screened to establish a classification model. The correct classification rate of each tree species was 97.9%, which had a good classification effect. Compared with the full spectrum model and the recursive feature elimination SVM model, SVM-SCARS can filter out fewer feature variables, and the model has better prediction performance and stability. The results show that the SVM-SCARS algorithm can effectively optimize the spectral characteristic variables and improve the robustness and applicability of near-infrared on-line analysis model in wood material analysis.
其他文献
2004年对新疆地区的草地地上生物量进行了大范围的调查,据此估算了新疆6种主要草地类型的地上生物量密度和总量,并探讨了草地地上生物量与环境因子的关系。结果表明,草原类型
外语学习是一种自主的学习过程,学习者必须具有很强的自主学习能力才能真正学好外语。俄语作为母语以外的第二语言,学习的难度与其他外语是一样的。因此,培养俄语学生的自主
云法造境—钟章法艺术作品收藏馆开馆仪式暨《中国近现代名家画集—钟章法》大红袍画集首发仪式于2011年10月在浙江武义县同时举行。金华市委常委、宣传部长陶诚华,浙江师范
12月12日,中国领先的互联网企业人人公司(NYSE:RENN)宣布,旗下的实名制社交网络平台人人网全新个人主页——人人时间轴全面开放。随着时间轴的全面开放,电影、足迹、上传老照
腺苷酸活化蛋白激酶(AMP-activated protein kinase,AMPK)是一种进化保守的丝氨酸/苏氨酸蛋白激酶,被称为“细胞能量调节器”,是维持细胞和机体能量平衡的关键分子。近年来的
《恒河女子》是玛格丽特·杜拉斯自编自导的电影。是杜拉斯的"印度系列"中的一部。《恒河女子》以一种流动性的意象创造出多重空间感。本文以此为主题展开探讨,希望能起到启
<正> 我国城市社会保障体制的改革与完善需要发挥社区的作用1.国际社会对社区的重视20世纪70年代以来,随着各国对本国经济发展及其国际竞争力的关注,自40年代以来追求福利社
本文对郑张尚芳在《上古音系》中提出的确定上古汉语元音音位的方法及其理论基础进行了分析,认为郑张尚芳的方法不符合音位学的基本原理。郑张尚芳提出的元音的“对称性”原则
目的了解发热患儿家属掌握发热相关护理知识的程度及健康教育需求情况。方法采用自行设计问卷调查表的方法,随机对住院的260名发热患儿家属进行调查。由调查人员介绍调查的目
本研究以美国传播学家鲍尔·洛基奇和德福勒提出的“媒介系统依赖理论”为研究框架和分析落点,又以青年亚文化为研究视角和分析窗口,通过文献研究、问卷调查和深度访谈等方法