面向Stacking集成的改进分类算法及其应用

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:youlan26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高Stacking集成算法的分类性能,充分利用Stacking学习机制产生的先验信息和贝叶斯网络丰富的概率表达能力,提出一种基于属性值加权朴素贝叶斯算法的Stacking集成分类算法AVWNB-Stacking(Stac-king based Attribute Value Weight Naive Bayes).通过考虑属性值这个深层次的因素,以互信息(Mutual Informa-tion,MI)作为权值度量的基础,对属性权值向量横向扩展为每个属性值分配一个权值,避免不同的属性值共享相同的权值,从而解决朴素贝叶斯算法作为Stacking元分类器由于属性独立性假设带来的分类精度损失.实验结果表明,相比于传统算法及其他元分类器的Stacking分类算法,AVWNB-Stacking算法有效提高了模型的分类性能,在两个测试集上AUC值分别达到了0.8007和0.8607.
其他文献
设计一种安全与便捷均衡的蓝牙SIM型智能IC卡产品.该产品以国密安全芯片为控制核心,结合蓝牙芯片和三轴地磁传感器,将各模块封装成蓝牙SIM型智能IC卡硬件形态,可直接嵌入到手机卡槽内,实现便捷使用.该方案符合智能IC卡检测规范,可为移动应用App提供安全、便捷的数字签名与信息加密服务.所设计的产品支持安卓和iOS两大主流系统,支持SM2、SM3、SM4等国密算法,可用于公开密钥基础设施的各种应用场景.目前该产品在金融领域的应用实践表明其兼具安全与便捷的性能.
为提高家庭服务机器人指令中目标对象预测的准确率,提出一种基于混合深度学习的多模态自然语言理处理(Natural Language Processing,NLP)指令分类方法.该方法从语言特征、视觉特征和关系特征多模态入手,采用两种深度学习方法分别以多模态特征进行编码.对于语言指令,采用多层双向长短期记忆(Bi-LSTM)进行子词嵌入和编码;对于非语言场景,使用卷积神经网络进行编码.最终得到每个目标-源对可能性的区域范围.实验结果表明,该方法能够提高机器人接收指令任务中目标对象预测的准确率且性能优于现有其他
针对网购消费者异常行为特征难提取、特征维度高和检测精度低等问题,提出一种基于自动编码器的孤立森林模型,用于网购消费者异常行为检测.通过自动编码器对网购消费者数据进行降维处理,利用孤立森林进行异常行为检测,利用网格搜索算法进行参数调优.实验结果表明,该模型降维效果、检测精度都优于主成分分析方法(PCA)与模糊C均值结合模型,对于网购消费者异常行为检测问题有实际的意义.
为减少实用拜占庭容错(PBFT)算法的通信开销,现有研究主要通过选举方式在保证安全的前提下挑选少量节点参与共识,但其灵活性差、容错率低、资源耗费高.对此,通过建立信用节点列表和信用评价机制,提出一种基于可信列表的改进拜占庭容错算法(CPBFT).仿真分析表明,较PBFT算法,CPBFT算法不仅能提高节点灵活性和容错率,还降低了约42.74%的通信带宽开销,提升了约3.12%的交易吞吐量,降低了约3.03%的时延,具有一定性能优势.
在数据生产速度波动较大的场景,为了实时ETL资源利用更合理,提出基于稳定匹配的ETL弹性调度机制.预测数据源的数据生产速度,并计算满足预测值的消费数据速度;使用贪婪负载均衡算法,调整ETL服务个数使节点负载均衡;确定ETL操作匹配关系,使消费数据速度最大且代价最小.该调度机制将匹配问题转化为最小费用最大流问题,并提出基于Dicnic算法的改进算法.实验结果表明,该调度机制在资源使用方面具有优势.
由于旅客-航班异构网络仅有高度稀疏的民航旅客同行记录,现有子图抽取方法难以从旅客-航班异构网络中获得旅客同行子图.对此提出基于旅客-航班异构网络的旅客同行子图抽取算法.将旅客-航班异构网络转换为旅客-旅客同构网络,通过随机游走方法得到旅客间的潜在同行关系,使用标签传播算法进行子图抽取.在国内某航空公司的旅客订票数据集上的实验表明,相比于LPA、COPRA、CPM等基准算法,该算法在模块度和标准化互信息上具有更好效果.
双目视觉一直是一个重要的研究方向,目前已经有很多的模型和算法,但绝大部分的模型和算法只能应用在视差满足唯一性约束的情况下.当场景中存在半透明遮挡物时,图像中同一位置可能对应于多个物体和多个视差,此时绝大部分的算法都不适用.针对可能存在半透明遮挡的问题,比较了部分传统匹配代价函数,提出一个新的基于灰度值归一化互相关(NCC)的代价函数来解决存在双层视差的问题.其具有一定的鲁棒性,在存在半透明遮挡和不存在半透明遮挡的情况下都适用.通过对比左右视差图等方法,去除了部分误匹配点,提升了结果的准确性.基于已有的双目
针对方面类别或方面词项子任务的情感分析方法性能受单任务网络结构的限制,且相关任务的数据集不足.为此,提出一种基于多任务学习的方面级情感分析模型,共同学习两个子任务和方面词项重建任务.通过共享双向门控循环单元和Sentence-level的注意力对多个任务的句子向量编码,并利用Aspect-level的注意力针对不同方面捕获句子中的不同内容.使用双重注意力能更好地注意方面词和情感词,从而提高精确率.在SemEval三个数据集上的实验结果表明,该方法对方面级情感分析任务有明显的优化作用,与现有基线模型相比在精
红外热成像视频与可见光视频相比噪点较多,细节模糊,缺少颜色特征,传统算法常出现目标检测错误、目标跟踪丢失的情况.对此,将YOLOV3目标检测算法与核相关滤波算法相结合,进行红外视频目标的检测及跟踪任务.加载训练后的YOLOV3网络模型进行第一帧目标检测,完成目标跟踪的初始化目标选取,使用KCF算法对后续视频帧进行目标跟踪.在跟踪目标丢失时启动目标再检测,匹配丢失目标并调整跟踪器.实验结果表明,该方法能够克服目标跟踪丢失的情况,且在实验平台上计算速度可达到实时要求.
针对民航机场场面监视领域多点定位系统固定形状的基站布局方式造成进出场飞机定位精度低的问题,建立监视区域内基站布局问题的数学模型.以GDOP数值工具为定位精度评判标准,利用免疫寻优算法计算得到最优的基站布局方案;将此布置基站方案与星形、T形布置基站方式进行图形和数据的对比,同时又在此布置基站方案下改变主站位置来进行数据对比.仿真结果和对比数据表明免疫寻优算法布置基站的最优性且可以显著提高飞机定位精度.