论文部分内容阅读
摘要: 利用偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立甘蔗清糖浆锤度近红外光谱分析的优化模型。SG平滑模式的扩展、SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优化。
关键词: 近红外光谱;偏最小二乘法;Savitzky-Golay平滑;甘蔗清糖浆;锤度
中图分类号:NO4 文献标识码:A 文章编号:1671-7597(2011)0210001-01
现代近红外光谱技术以其分析速度快、精度适中、成本低、非破坏性和易于实现在线、实时分析等优点,已在农业、食品、医药、烟草、石油化工等领域中得到应用[1]。在甘蔗品质分析和甘蔗制糖过程管理中,锤度是最基础、最重要的品质评价指标之一。分析模型优化对于提高近红外光谱预测能力是非常重要的。
采用广西某糖厂的105个甘蔗清糖浆样品及其用常规方法测定的锤度数据(作为光谱分析的参考化学值),全体样品锤度化学值范围在57.00~67.16%。采用Foss公司的XDS Rapid Liquid光栅型近红外光谱分析仪,光谱范围400~2500nm,样品池光程为1mm,实验室温度(25±1)℃,用透射方式扫描获得近红外吸收光谱。
计算105个甘蔗清糖浆样品的吸光度与锤度化学值在每个波长点的相关系数。并在每个波长点建立吸光度与锤度的单点线性回归模型,得到预测样品的锤度预测值与化学值的RMSEP值。如图1给出甘蔗清糖浆锤度单波長回归模型的RMSEP均值和标准差。按照RMSE最小找到最优波长最优为2278.5nm。根据清糖浆锤度2278.5nm最优单波长模型计算每个样品的单波长预测偏差SWPB[2]。根据SWPB划分定标集和预测集,按大约2:1的比例可将全部105个样品划分为70个定标集和35个预测集。
采用偏最小二乘法(PLS)和光谱SG平滑方法建立定标模型。SG平滑的参数包括导数阶数、多项式次数和平滑点数。考虑到有些实际测量体系(比如测量数据波长间隔小的情形)可能需要更多的平滑点数,本文将平滑点数从原有的5到25之间奇数[3]扩充为5到81之间的奇数,多项式次数扩充为n=2,3,4,5,6(原为n=2,3,4,5),按原方法[3]编写程序计算,得到14个涵盖原有平滑系数的平滑系数表,共有483个平滑模式(原有117个),是适用范围更宽的SG平滑预处理群。本文建立计算机算法平台,利用Matlab7.6语言编写实现每次PLS数值实验,把483种SG平滑模式和1~40的PLS因子数任意组合分别建立PLS模型,按照预测效果优选SG平滑模式和PLS因子数,从而得到近红外光谱分析的优化模型。
为了比较,全谱(400~2500nm)在SG平滑前用PLS直接建模与SG平滑处理后构建的PLS模型对比。各阶导数平滑最优PLS模型的预测效果如表1所示。由表1可见,原谱平滑模型的预测精度优于未做SG平滑直接PLS的预测效果。从而表明,SG平滑模式的扩展、SG平滑模式和PLS因子数的联合全局筛选能够有效地应用于近红外光谱分析的模型优化。
参考文献:
[1]Williams P, Norris K. Near-infrared Technology in the Agricultural and Food Industries(Second Edition)[M]. Minnesota (USA): the American Association of Cereal Chemists, Inc. St. Paul, 2001.
[2]谢军、潘涛、陈洁梅等,血糖近红外光谱分析的Savitzky-Golay平滑模式与PLS因子数的联合优选,分析化学,2010,38(3):342-346.
[3]Savitzky A, Golay M J E. Smoothing and Differentiation of Data by Simplified Least Squares Procedures[J]. Analytical Chemistry, 1964, 36(8): 1627-1637.
作者简介:
刘登飞(1978-),男,江西省赣州市人,中山火炬职业技术学院专任教师,研究方向:光电技术、应用光谱。
关键词: 近红外光谱;偏最小二乘法;Savitzky-Golay平滑;甘蔗清糖浆;锤度
中图分类号:NO4 文献标识码:A 文章编号:1671-7597(2011)0210001-01
现代近红外光谱技术以其分析速度快、精度适中、成本低、非破坏性和易于实现在线、实时分析等优点,已在农业、食品、医药、烟草、石油化工等领域中得到应用[1]。在甘蔗品质分析和甘蔗制糖过程管理中,锤度是最基础、最重要的品质评价指标之一。分析模型优化对于提高近红外光谱预测能力是非常重要的。
采用广西某糖厂的105个甘蔗清糖浆样品及其用常规方法测定的锤度数据(作为光谱分析的参考化学值),全体样品锤度化学值范围在57.00~67.16%。采用Foss公司的XDS Rapid Liquid光栅型近红外光谱分析仪,光谱范围400~2500nm,样品池光程为1mm,实验室温度(25±1)℃,用透射方式扫描获得近红外吸收光谱。
计算105个甘蔗清糖浆样品的吸光度与锤度化学值在每个波长点的相关系数。并在每个波长点建立吸光度与锤度的单点线性回归模型,得到预测样品的锤度预测值与化学值的RMSEP值。如图1给出甘蔗清糖浆锤度单波長回归模型的RMSEP均值和标准差。按照RMSE最小找到最优波长最优为2278.5nm。根据清糖浆锤度2278.5nm最优单波长模型计算每个样品的单波长预测偏差SWPB[2]。根据SWPB划分定标集和预测集,按大约2:1的比例可将全部105个样品划分为70个定标集和35个预测集。
采用偏最小二乘法(PLS)和光谱SG平滑方法建立定标模型。SG平滑的参数包括导数阶数、多项式次数和平滑点数。考虑到有些实际测量体系(比如测量数据波长间隔小的情形)可能需要更多的平滑点数,本文将平滑点数从原有的5到25之间奇数[3]扩充为5到81之间的奇数,多项式次数扩充为n=2,3,4,5,6(原为n=2,3,4,5),按原方法[3]编写程序计算,得到14个涵盖原有平滑系数的平滑系数表,共有483个平滑模式(原有117个),是适用范围更宽的SG平滑预处理群。本文建立计算机算法平台,利用Matlab7.6语言编写实现每次PLS数值实验,把483种SG平滑模式和1~40的PLS因子数任意组合分别建立PLS模型,按照预测效果优选SG平滑模式和PLS因子数,从而得到近红外光谱分析的优化模型。
为了比较,全谱(400~2500nm)在SG平滑前用PLS直接建模与SG平滑处理后构建的PLS模型对比。各阶导数平滑最优PLS模型的预测效果如表1所示。由表1可见,原谱平滑模型的预测精度优于未做SG平滑直接PLS的预测效果。从而表明,SG平滑模式的扩展、SG平滑模式和PLS因子数的联合全局筛选能够有效地应用于近红外光谱分析的模型优化。
参考文献:
[1]Williams P, Norris K. Near-infrared Technology in the Agricultural and Food Industries(Second Edition)[M]. Minnesota (USA): the American Association of Cereal Chemists, Inc. St. Paul, 2001.
[2]谢军、潘涛、陈洁梅等,血糖近红外光谱分析的Savitzky-Golay平滑模式与PLS因子数的联合优选,分析化学,2010,38(3):342-346.
[3]Savitzky A, Golay M J E. Smoothing and Differentiation of Data by Simplified Least Squares Procedures[J]. Analytical Chemistry, 1964, 36(8): 1627-1637.
作者简介:
刘登飞(1978-),男,江西省赣州市人,中山火炬职业技术学院专任教师,研究方向:光电技术、应用光谱。