软件缺陷集成预测模型研究

来源 :计算机应用研究 | 被引量 : 12次 | 上传用户:hbffff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用单一分类器构造的缺陷预测模型已经遇到了性能瓶颈,而集成分类器相比单一分类器往往具有显著的性能优势。以构造高效的集成缺陷预测模型为出发点,比较了七种不同类型集成分类器的算法和特点。在14个基准数据集上的实验显示,部分集成预测模型的性能优于基于朴素贝叶斯的单一预测模型。其中,基于投票的集成分类框架具有最优的预测性能以及统计学意义上的性能优势显著性,随机森林算法次之。Stacking集成框架也具有较强的泛化能力。
其他文献
标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为学习其他标记提供有用信息。分类器链中标记的预测顺序具有随机性,分类结果存在着很大的不确定性与不稳定性,且容易造成错误信息的传播。为此充分考虑标记的局部分布特性,提出了一种局部顺序分类器链算法,解决分类器链中分类器顺序问题。实验表明,该算法性能优于其他常用多标记学习算法。
为提高频繁项集的产生效率,提出一种在垂直数据表示下,基于先验位运算的频繁项集挖掘算法(A-FIMBII)。该算法建立从项集合到事务的索引,利用先验性质减少候选集的产生,通过位运算计算支持度。与Apriori、Eclat算法进行了比较,实验表明,A-FIMBII具有更高的效率。
黑色素瘤的计算机辅助诊断是基于激光共聚焦扫描显微镜(CLSM)皮肤图像纹理特征,并引入机器学习的技术,为临床应用研发的一种能够准确、有效地识别在体恶性黑色素瘤新医学诊断方
为了满足群组通信的高安全性,将超椭圆曲线密码体制与Schnorr数字签名体制相结合,设计了一个高安全的同时具有(t,n)门限签密和(k,l)门限共享验证功能的门限群签密方案。该方案克服了彭等人和Wang等人方案的安全缺陷,利用Desmedt等人的密钥重新分配协议的思想实现了门限签密和门限解签密的密钥先应式秘密共享。与现有的面向群组通信的广义门限签密方案相比,该方案能避免恶意信息的攻击,能抵抗内部欺
为了提高中文文本情感识别的精度,从集成学习的角度出发,提出了一种基于样本空间动态划分的机制构建文本情感分类器。该算法充分利用训练样本空间内的鉴别信息,通过引入核平滑方法对样本空间进行自适应划分,形成若干个具有差异性的多粒度样本子集,然后分别在每个子集上构造基分类器,最后将所有基分类器的输出进行融合以产生最终的预测结果。实验结果表明,该算法在查准率和查全率等方面均优于Bagging、AdaBoost
针对无线传感器网络节点数量多、通信距离短、能量有限的特点,提出一种查询增益路由算法以及基于路由的负载均衡机制。查询增益路由算法通过查询增益矩阵维护路由信息,并依据历史查询成功记录来选取路由节点;而基于路由的负载均衡机制可以在查询路由过程中记录节点的能量信息,转移负载,使得查询路径中各节点的能量消耗得到均衡。仿真实验结果表明,查询增益路由算法可以在降低节点能量消耗的前提下提高查询成功率,而基于路由的
对语种识别系统的算法运算量和复杂度进行分析可知:其前端特征提取和预处理部分运算量较小,且算法相对灵活;而后端建模分类部分算法运算量较大且算法相对稳定,是系统实现大规模并行处理的瓶颈。基于此,提出了一种DSP+FPGA的系统实现架构,对前端特征提取采用浮点DSP进行算法实现,而后端则采用FPGA设计进行算法实现,并对系统进行了性能测试和资源分析,验证了设计的合理性。
为满足耦合地球系统模式应用的需求,提出了一种二维样条插值算法,并将其有效地实现成插值模块封装进地球系统建模框架(earth system modeling framework,ESMF)。该算法基于经典样条算法,根据地球系统模式特点进行修改,用两次一维插值扩张成二维插值,引入极点区域外插处理,将插值权重生成与插值结果计算两部分分离。实验结果表明,该算法能获得高精度的插值结果,模块化的设计使得用户可
针对现行的3GPP网络路由协议在路由选择时存在的可靠性低、路由开销大等问题,分析了网络中通信节点的工作状态,综合考虑协同合作方式的DSR路由机制和拥塞控制策略对3GPP网络性能的影响,提出了一种基于拥塞控制的增强型协作DSR路由协议,并通过3GPP网络系统级仿真验证改进后的协作路由协议的通信性能。仿真结果表明,所提的协作DSR协议显著提高了3GPP网络通信性能,在提高网络资源利用率的同时改善了数据
由于网络用户讨论的主题变化频繁,因此在进行倾向性判定时,难以预先构造出满足各种情况的训练语料。针对上述问题,提出了一种意见领袖识别中的文本倾向性判定方法,进而建立考虑回复帖子倾向性的意见领袖发现模型。该模型建立在影响力扩散概率模型(IDPM)上,模型中引入了考虑帖子倾向性的有效系数。实验表明,该方法是有效的,其前50个的平均精确率相对分别提高了10.97%和5.45%。