【摘 要】
:
极限学习机(Extreme Learning Machine,ELM)具有学习速度快和泛化性能较强的优点,它被广泛应用于分类问题的研究中。由于连接权重的随机初始化,ELM的网络输出往往不够稳定。与ELM相同,单类极限学习机(One-Class ELM,OCELM)同样具有输出稳定性较差的缺点。由于能够加强模型的稳定性和泛化性能,集成学习一直被认为是机器学习领域中一个重要的研究分支。为了提高OCEL
【基金项目】
:
国家自然科学基金面上项目:基于信息理论学习的单类分类关键问题研究(No.61672205); 河北省自然科学基金资助项目:基于信息理论学习的前馈神经网络学习方法研究(No.F2017201020);
论文部分内容阅读
极限学习机(Extreme Learning Machine,ELM)具有学习速度快和泛化性能较强的优点,它被广泛应用于分类问题的研究中。由于连接权重的随机初始化,ELM的网络输出往往不够稳定。与ELM相同,单类极限学习机(One-Class ELM,OCELM)同样具有输出稳定性较差的缺点。由于能够加强模型的稳定性和泛化性能,集成学习一直被认为是机器学习领域中一个重要的研究分支。为了提高OCELM的输出稳定性和泛化能力,利用集成策略将多个OCELM组合在一起,构造OCELM集成模型。本文的主要工作如下:1.提出了一种基于旋转变换的OCELM选择性集成方法。构造所提方法需要两个阶段:首先利用基于主成分分析的旋转变换构造多个新的训练样本子集,利用这些新的训练样本子集分别学习相应的个体OCELM;然后使用基于夹角余弦的多样性度量计算集成模型中每个OCELM的多样性,剔除多样性较低的OCELM。对于待测样本,采用投票法将其分类为正常或异常数据。通过在基准数据集上与相关方法进行比较,验证了所提集成方法的有效性。2.提出了一种基于堆叠稀疏自编码器的OCELM集成方法。为了使自编码器取得更为稀疏的特征表示,在自编码器的目标函数中增加基于Transformed-l1和l21范数的正则化项,构造稀疏自编码器,并在其基础之上,进一步构造堆叠稀疏自编码器,以提高稀疏自编码器的特征表达能力。此外,为了充分利用堆叠自编码器中各个瓶颈层中的特征信息,分别利用各个瓶颈层的特征学习相应的OCELM,构造OCELM集成模型。在基准数据集上将所提集成方法与相关方法进行了实验比较,实验结果表明所提集成方法具有更优的分类性能。
其他文献
本文主要考察现代汉语中“否+A+否+B”格式,包括“无A无B”“不A不B”“非A非B”“没A没B”四个格式。本文对四个格式内部的语法关系、语义关系和表量类型进行了细致分析,并通过比较得出四个格式的相同点和不同点。本文共分为三部分:第一部分为绪论,介绍了本文的研究对象、研究内容和研究意义,梳理前人研究的重要成果,并阐述本文的研究方法和语料来源等情况。第二部分为正文,包括第二到六章,介绍了“无A无B”
《甲库善本》全称《原国立北平图书馆甲库善本》,其收录的古籍为原清内阁大库藏书,总数量达到了三千余种。《甲库善本》收录的这一批古籍的版本主要以元明刻本为主,同时兼有部分宋刻本、清刻本以及抄本,版本丰富,数量众多。在目前宋刻本流传已经十分稀少,元明刻本流传也逐渐稀少的情况之下,《甲库善本》所收录众多古籍的版本价值便值得进行深入地探讨与研究,因此本文的主要内容就是利用文献学的基本方法,以客观事实为依据,
数字经济为“数字丝绸之路”国家经济发展提供新动能,中国数字经济在“一带一路”沿线国家中的总量上有明显的优势,却不能意味着较高的数字经济效率。当我国的数字经济效率具有较大优势时,将数字经济发展经验及数字经济成果共享,创造新价值,为实现“一带一路”的互联互通合作共赢提供力量。对数字经济效率进行测算,以新的视角研究“一带一路”沿线国家数字经济的发展势在必行。本文运用三阶段超效率SBM模型,引入外部环境变
党中央、国务院历来高度重视安全生产工作,习近平总书记多次发表重要讲话,指出安全生产是企业必须做到的一件事情,是企业发展的边界线,即企业不能通过牺牲人的生命,付出这样的代价达到发展的目的。但近些年来,经常发生重大的安全生产事故,引发大量人员伤亡和大量财产损失的不良影响,带来了极其恶劣的社会影响。经统计数据得出结论:大部分的生产安全事故的原因是企业违法违规进行生产经营,其中又有很大一部分原因是安全生产
简帛书是先秦至魏晋时期古人以简牍和缣帛为载体所书写的墨迹。简帛书法自19世纪末一经发现就备受学界关注,而简帛书法资料的日渐丰富又进一步推动了人们对简帛书法的认识。简帛隶书是最真实的隶书真迹,是碑刻铭文书法无法代替的古人墨迹,因此简帛书法对当代隶书创作和研究是不可或缺的重要内容。简帛书法对当代隶书创作产生了重要的影响,但目前对这方面的研究并不充分。本文首先对秦汉时期简帛的使用情况和当下的简帛实物的发
自改革开放以来,我国经济发展进入新时代,正大步向高质量发展的新阶段迈进。2013年5月初,中共河北省委第八届五次全会提出只有实现“无中生有”的目标来发展战略性新兴产业,提高“有中生新”的速度来优化传统产业,才能符合新阶段的任务与要求,实现河北省经济的高质量发展。因此,对河北省战略性新兴产业与传统产业进行评价指标体系的构造,深入探讨两类产业间的协调发展状况及影响因素,不仅能够为正确处理好两类产业的关
本文旨在调查阅读推广活动中的读者从众行为特点,厘清读者从众行为对活动参与意愿的影响效果,为公共图书馆阅读推广活动设计、宣传提供参考。研究基于从众理论和阅读推广活动实践案例推演得出读者从众行为模型,以多个省份、城市公共图书馆为样本基地,在馆长和馆员的帮助下,对参加阅读推广活动的读者开展线上和线下问卷调查。问卷以读者从众行为模型为框架,共包括社会人口学资料统计和从众行为调查两部分。应用SPSS21.0
在当今计算机网络时代,微博、淘宝、京东等应用平台给人们的生活带来了很大的便利,与此同时,大量的评论与观点由此而生。用户的评论与观点代表着用户的情感倾向。掌握用户的情感倾向,就可以有效地为用户推荐或规避某些话题或者商品。如何从这些内容中把重要的情感信息挖掘出来显得尤为重要。本文针对文本的情感分析任务,提出了一种情感分析残差网络模型,该模型充分利用了相似文本之间的特征关联性,在情感分析任务上取得了良好
伴随着系统仿真和控制芯片性能的日趋发展,对于现在的控制需求来说仅仅依靠纯数学仿真显得力不从心。由此而来的半实物仿真技术逐渐得到了普及,因它兼具纯数学仿真和物理试验的特性,所以在工业界得到了广泛的应用。本文通过对半实物仿真技术进行分析与研究,结合学校中的实际情况,在保证性能的前提下,控制设计成本,搭建了基于STM32与MATLAB/Simulink的半实物仿真平台,满足了教学与科研中的需求。为了验证
传统的单类支持向量机(one-class support vector machine,OCSVM)在非监督学习领域中取得了较优的性能,从而得到了越来越多的关注。然而,OCSVM存在以下不足之处:一、OCSVM的分类性能在很大程度上依赖于核函数及其参数的选取,若选取不当,则OCSVM就会取得较差的分类效果,而对OCSVM的核函数及其参数的选取迄今仍无可靠的理论依据;二、OCSVM对训练集中的噪声非