软件缺陷集成预测模型研究

来源 :计算机应用研究 | 被引量 : 12次 | 上传用户：hbffff

【摘要】

：

利用单一分类器构造的缺陷预测模型已经遇到了性能瓶颈,而集成分类器相比单一分类器往往具有显著的性能优势。以构造高效的集成缺陷预测模型为出发点,比较了七种不同类型集成分类器的算法和特点。在14个基准数据集上的实验显示,部分集成预测模型的性能优于基于朴素贝叶斯的单一预测模型。其中,基于投票的集成分类框架具有最优的预测性能以及统计学意义上的性能优势显著性,随机森林算法次之。Stacking集成框架也具有较

【作者】

：

刘小花王涛吴振强

【机构】

：

陕西师范大学计算机科学学院

【出处】

：

计算机应用研究

【发表日期】

：

2013年06期

【关键词】

：

软件缺陷预测集成分类投票随机森林 software defect prediction classifiers ensemble vote rand

【基金项目】

：

国家自然科学基金面上项目（61173190）, 陕西省自然科学基础研究计划项目（2009JM8002）, 中央高校基本科研业务费专项资金资助项目（GK201302055）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

用于多标记学习的局部顺序分类器链算法

标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为学习其他标记提供有用信息。分类器链中标记的预测顺序具有随机性,分类结果存在着很大的不确定性与不稳定性,且容易造成错误信息的传播。为此充分考虑标记的局部分布特性,提出了一种局部顺序分类器链算法,解决分类器链中分类器顺序问题。实验表明,该算法性能优于其他常用多标记学习算法。

期刊

多标记学习标记相关性分类器链K-近邻multi-label learning label correlation classifier chains

基于先验位运算的频繁项集挖掘

为提高频繁项集的产生效率,提出一种在垂直数据表示下,基于先验位运算的频繁项集挖掘算法(A-FIMBII)。该算法建立从项集合到事务的索引,利用先验性质减少候选集的产生,通过位运算计算支持度。与Apriori、Eclat算法进行了比较,实验表明,A-FIMBII具有更高的效率。

期刊

频繁项集Eclat算法先验索引表vfrequent itemset Eclat algorithm Apriori inverted index

几种机器学习方法在黑色素瘤计算机辅助诊断中的性能比较

黑色素瘤的计算机辅助诊断是基于激光共聚焦扫描显微镜（CLSM）皮肤图像纹理特征,并引入机器学习的技术,为临床应用研发的一种能够准确、有效地识别在体恶性黑色素瘤新医学诊断方

期刊

黑色素瘤计算机辅助诊断机器学习melanoma computer aided diagnosis machine learning

一种高安全的门限群签密方案

为了满足群组通信的高安全性,将超椭圆曲线密码体制与Schnorr数字签名体制相结合,设计了一个高安全的同时具有(t,n)门限签密和(k,l)门限共享验证功能的门限群签密方案。该方案克服了彭等人和Wang等人方案的安全缺陷,利用Desmedt等人的密钥重新分配协议的思想实现了门限签密和门限解签密的密钥先应式秘密共享。与现有的面向群组通信的广义门限签密方案相比,该方案能避免恶意信息的攻击,能抵抗内部欺

期刊

门限群签密门限验证密钥重新分配高安全带宽受限超椭圆曲线密码体制threshold group signcryption threshold ve

一种基于样本空间动态划分的中文情感识别方法

为了提高中文文本情感识别的精度,从集成学习的角度出发,提出了一种基于样本空间动态划分的机制构建文本情感分类器。该算法充分利用训练样本空间内的鉴别信息,通过引入核平滑方法对样本空间进行自适应划分,形成若干个具有差异性的多粒度样本子集,然后分别在每个子集上构造基分类器,最后将所有基分类器的输出进行融合以产生最终的预测结果。实验结果表明,该算法在查准率和查全率等方面均优于Bagging、AdaBoost

期刊

文本情感识别样本子空间动态划分集成分类模型核平滑Key words： text sentiment recognition sample subsp

一种无线传感器网络环境下的查询路由与负载均衡机制

针对无线传感器网络节点数量多、通信距离短、能量有限的特点,提出一种查询增益路由算法以及基于路由的负载均衡机制。查询增益路由算法通过查询增益矩阵维护路由信息,并依据历史查询成功记录来选取路由节点;而基于路由的负载均衡机制可以在查询路由过程中记录节点的能量信息,转移负载,使得查询路径中各节点的能量消耗得到均衡。仿真实验结果表明,查询增益路由算法可以在降低节点能量消耗的前提下提高查询成功率,而基于路由的

期刊

无线传感器网络查询路由负载均衡能量消耗wireless sensor networks（WSNs） query routing load balan

一种多路实时语种识别系统设计与实现

对语种识别系统的算法运算量和复杂度进行分析可知:其前端特征提取和预处理部分运算量较小,且算法相对灵活;而后端建模分类部分算法运算量较大且算法相对稳定,是系统实现大规模并行处理的瓶颈。基于此,提出了一种DSP+FPGA的系统实现架构,对前端特征提取采用浮点DSP进行算法实现,而后端则采用FPGA设计进行算法实现,并对系统进行了性能测试和资源分析,验证了设计的合理性。

期刊

多路实时语种识别FPGA并行处理multiple and real-timelanguage identificationFPGAparallel

样条插值算法在耦合地球系统模式中的应用

为满足耦合地球系统模式应用的需求,提出了一种二维样条插值算法,并将其有效地实现成插值模块封装进地球系统建模框架(earth system modeling framework,ESMF)。该算法基于经典样条算法,根据地球系统模式特点进行修改,用两次一维插值扩张成二维插值,引入极点区域外插处理,将插值权重生成与插值结果计算两部分分离。实验结果表明,该算法能获得高精度的插值结果,模块化的设计使得用户可

期刊

二维样条插值地球系统建模框架耦合地球系统模式模块化设计插值权重2-dimensinal spline interpolationESMF（earth

3GPP中基于拥塞控制的协作DSR路由协议研究

针对现行的3GPP网络路由协议在路由选择时存在的可靠性低、路由开销大等问题,分析了网络中通信节点的工作状态,综合考虑协同合作方式的DSR路由机制和拥塞控制策略对3GPP网络性能的影响,提出了一种基于拥塞控制的增强型协作DSR路由协议,并通过3GPP网络系统级仿真验证改进后的协作路由协议的通信性能。仿真结果表明,所提的协作DSR协议显著提高了3GPP网络通信性能,在提高网络资源利用率的同时改善了数据

期刊

第三代合作伙伴计划协作路由协议动态源路由协议拥塞控制the 3rd generation partnership project（3GPP） coop

意见领袖识别中的文本倾向性研究

由于网络用户讨论的主题变化频繁,因此在进行倾向性判定时,难以预先构造出满足各种情况的训练语料。针对上述问题,提出了一种意见领袖识别中的文本倾向性判定方法,进而建立考虑回复帖子倾向性的意见领袖发现模型。该模型建立在影响力扩散概率模型(IDPM)上,模型中引入了考虑帖子倾向性的有效系数。实验表明,该方法是有效的,其前50个的平均精确率相对分别提高了10.97%和5.45%。

期刊

意见领袖识别倾向性分析影响力扩散概率模型opinion leader identification orientation identification

软件缺陷集成预测模型研究

其他学术论文