基于线性回归的特征提取算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:ronglao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性回归是机器学习中比较热门的研究方法,广泛应用于分类、识别等多个领域。由于具有形式简单、易于建模、良好的可解释性等优点,线性回归是目前应用最广泛的方法。本文提出了三种新的线性回归方法,具体工作如下:首先,论文提出基于样本特征核矩阵的稀疏双线性回归(KMSBR)。该模型利用特征映射将样本特征映射到高维空间,并构建基于样本的特征核矩阵。以样本的特征核矩阵作为输入定义双线性损失函数,同时以L2,1范数作为正则化项来建立回归模型,得到行稀疏的左右回归系数矩阵,实现在高维特征空间中对重要样本和重要特征的选择。其次,提出基于图的低秩双线性回归模型(GLRBR)。该模型可以直接将图像矩阵数据作为输入数据,使用左右回归系数矩阵来进行线性拟合。这种方法使用低秩表示和样本的局部保持性为正则化约束条件,保持矩阵数据的全局结构和局部结构,提高算法分类性能。最后,提出基于图的稀疏松弛双线性回归模型(GSRBR)。首先,GSRBR可以直接将图像矩阵数据作为输入数据,并利用L2,1范数作为正则化项来建立回归模型得到行稀疏的回归系数矩阵。其次,GSRBR使用样本的局部保持性来发现图像样本的判别信息和局部几何结构。除此以外,GSRBR还通过引入非负标签松弛矩阵,将严格的二元标签矩阵松弛为松弛变量类标签矩阵。在若干数据集上的实验结果表明,本文提出的三种方法能有效地提高算法的运行效率,且预测精度要优于已有的几种模型。
其他文献
2020年的全球公共卫生事件给全球经济带来了前所未有的冲击和挑战,但是游戏行业却迎来了超出预期的发展。疫情不断地解体和重构着人们旧有的观念和生活方式,由于游戏较低的成本和门槛,吸引了越来越多的人尝试并参与到游戏活动中,游戏不但在一定程度上释放了社会的压力,而且弥补了大众在社交方面的渴求。在所有的手游玩家中,轻手游类型玩家中一直占据着最为广阔的市场,拥有着可观的人群基数。由于轻手游较低的开发成本,各
贝叶斯网络(Bayesian network,BN)是目前不确定知识表达和推理领域最有效的理论模型之一,同时在如图像处理、疾病预测等领域得到越来越多的应用。BN结构与预测效果直接相关,学习BN结构也已被证明是NP难问题,因此快速准确的学习BN结构极为重要。启发式搜索算法已被广泛应用在BN结构学习问题中。基于遗传算法(Genetic algorithm,GA)的BN结构学习算法存在搜索时间过长、易陷
数字图像作为人们获取和传递信息的重要载体,在给人们生活带来便利的同时,也给社会带来了一些安全隐患。随着图像编辑软件的发展和普及,图像内容修改与图像伪造的成本变得越来越低,用户可以轻易利用图像编辑工具修改图像内容并且不留下明显的视觉痕迹。篡改图像在互联网中的肆意传播将对军事、政治、传媒等领域带来负面影响,因此,数字图像取证研究具有十分重要的现实意义。本文针对图像操作篡改检测以及图像篡改区域定位开展研
随着大数据时代的到来,人们需要处理的数据量急速增长,如何快速有效地从浩瀚的网络中提取到关键信息,成为业界迫切需要解决的难题。关系提取由于其能够从大规模非结构化文本中提取结构化信息,而被广大研究者所关注。近年来,学者们将基于神经网络特征抽取的方法引入到关系提取任务中,取得了令人瞩目的成绩,这使得面向关系提取的神经网络研究成为热点。根据不同的数据集标注方式,关系提取方法主要分为全监督和远程监督两类。在
当代社会对教育的重视一方面丰富了教学内容,另一方面也加重了教师的工作负担。在保证阅卷质量的前提下将教师从繁重的批阅、统计工作中解放出来被视为现有条件下减轻教师负担的有效手段。目前大规模的英语考试阅卷大多采用光学标记识别技术的机器阅卷,它采用机读卡的形式,再以光电式阅卷机配合。一方面,这种阅卷方式虽在处理选择题上效率较高,精度较高,但填空题仍需人力配合。另一方面,由于考试练习频率高,大量机读卡的消耗
随着深度传感器和三维扫描仪的普及,三维点云得到了迅速发展。基于深度学习的三维场景理解已经成为一个研究热点。三维场景的点云数据处理包括目标分类、目标检测、实例分割、语义分割。在这些任务中,目标分类和场景语义分割都是目前研究的热点。然而,在处理点云数据时存在一些挑战。由于点的非结构化和无序性,使得研究者很难直接捕捉到点与点之间的复杂关系,一些网络只考虑到了原始坐标和单个点的特征信息,没有充分关注点云局
近年来,随着信息网络的迅猛发展,时刻都会产生纷繁冗余的数据,用户面对海量数据,可能无法准确对有效信息进行选择。因此,推荐系统作为帮助用户获取精准高效信息的必要工具应运而生。传统推荐方法容易遭受数据稀疏性和冷启动等问题,并且难以应对用户偏好以及用户与项目之间的关系随着时间的推移而产生变化的问题。矩阵分解和张量分解在推荐系统中得到广泛的应用,但二者还存在不少局限性,第一,线性模型参数的较小随机扰动可能
正例未标注分类简称PU分类,由于只有正例样本与未标注样本,传统的分类方法在PU分类中往往效果不甚理想。为PU问题构建稳健的分类是非常具有挑战性的,特别是对于负例样本压倒并且含有异常值(错误标记样本)的复杂数据。这种分类情况实际应用中十分常见,例如医疗保健,文本分类和生物信息学。尤其当数据高速发展的今天,如何快速准确的分类并实现在线学习成为当下研究中的热门,本文针对包含异常值的增量型PU分类研究如下
精确计算猪胴体中各个组织的重量和占比对于种猪育种是非常重要的,这有利于优化生产结构,培育出满足市场需求的优良性状种猪。医学影像学的发展为我们提供了许多无创的、高分辨率的仪器,其中最适合测量活体猪胴体组成的设备就是CT。CT是一种非侵入性的技术,目前已经被广泛应用于动物生产和畜体分级领域,它可以随时在猪体的生长过程中研究猪的身体构成而不必对其进行连续屠宰。CT图像使用Hounsfield units
《远山淡影》是英国日裔作家石黑一雄的处女作,作品在1982年一经出版便在西方文坛引起巨大反响。该书讲述了身处英国的日裔遗孀悦子,在大女儿景子自杀后回顾日本生活点滴的故事。主人公悦子有意虚构了佐知子和万里子这一对处在社会边缘地位的母女,来揭示日本女性在以男权为主导的日本社会所遭遇的重重压迫,以及悦子母女在母国和异乡所经历的身份困顿和压迫。《远山淡影》的一大特点是性别化叙事的运用。本文从女性主义叙事学