论文部分内容阅读
最优化是运筹学的一个重要分支,在经济、金融、工程、管理、军事与国防等诸多领域有广泛应用.特别地,它是机器学习与人工智能的关键技术.随着大数据时代的来临,数据规模越来越大,数据维数越来越高,现有最优化算法面临运算速度慢、计算量大的挑战.如何设计出快速有效的算法,是当今国际国内的一个热点研究课题.本文围绕机器学习中的一类随机优化算法进行研究,提出了一种新式快速算法. 本文首先介绍了研究背景及意义,并对前人所提出的针对大规模优化问题的两类算法作出概述,然后在比较和总结前人研究的基础上,提出了基于GS准则的小批量块坐标下降法.该算法具有如下特点:(1)给出了块坐标情形下的GS准则,通过该准则选取特定坐标块,使得算法在每一迭代步有最优的目标函数下降量;(2)结合随机梯度下降法的思想,通过随机选择部分样本计算局部梯度作为对全局梯度的近似,以达到减少计算量的效果,并且通过引入方差缩减技术,使得由随机选择样本所带来的方差渐近收敛至零;(3)在每轮迭代步选取梯度中单个坐标块来更新参数,从而进一步减少计算量. 本文基于4个真实数据集展开数值实验,从时间、计算量和稀疏度等方面比较不同算法效果,数值结果表明本文提出的算法对于求解大规模高维优化问题中的经典Lasso问题、稀疏逻辑回归以及多类别稀疏逻辑回归具有高效性与快速性.同时,本文还给出了以Python语言编写的算法软件包.