贝叶斯网络结构学习优化算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:silentmost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络(Bayesian Network,BN)作为一种概率图模型,得益于图论和概率论的结合,可以清晰地表现变量间的因果关系,在对不确定关系进行表示和推理中发挥了重要的作用,因此在人工智能、医疗、故障诊断、数据挖掘等领域有着广泛的应用。对BN的建模分为两个部分,结构学习和参数学习,其中结构学习是参数学习乃至对BN进行应用的基础和前提,从数据中对结构进行学习具有重要意义,也是本文的主要研究方向。由于搜索空间随着问题规模的增加而呈现超指数级增长,贝叶斯网络结构学习(BN Structure Learning,BNSL)的任务已被证明是NP-难的,引入智能优化算法是一种解决此类问题的思路,其中遗传算法(Genetic Algorithm,GA)近年来取得了诸多成果,但仍然面临着搜索效率低、准确度不高、与问题的结合不够紧密等问题。本文通过对基于GA的BNSL算法进行研究,通过利用搜索空间中的结构信息对GA的搜索行为进行改进;利用互信息和支持度挖掘种群中的优势信息引导GA进行快速收敛;此外还研究了BNSL算法在食品安全事故成因分析上的应用方法。本文的主要工作如下:(1)针对GA冗余搜索过多导致的搜索效率低下的问题,提出了一种基于结构信息改进的GA用于BNSL。首先利用精英个体的马尔科夫毯来指导交叉算子,通过局部的社会学习来提高算法的收敛速度;在此基础上利用评分等价原理进行有偏好的变异操作,随着算法迭代的停滞次数自适应调整偏好概率,加强了局部搜索能力进而提升了算法的探索性。通过两个算子的结合,算法在探索性和收敛性得到了更好的平衡且均有一定程度的提高。(2)受互信息的原理和在此领域中运用的启发,针对演化算法特有的种群优势,提出了基于互信息引导的GA。首先结合条件独立测试和互信息分别用于限制搜索空间和种群初始化空间,利用随机的个体参数保证种群多样性,提高了初始种群的评分;随后利用互信息和支持度挖掘种群中潜在的优势基因,并用于指导交叉算子中差异边的处理;此外在对无效解的处理上,利用互信息作为环路去除的指导,避免了优势基因在个体修复过程中的误删除。在11个数据集上的实验结果验证了互信息在该领域强大的指导作用,通过结合以上三个改进点的优势,算法最终在收敛速度和所得结构的准确度上均有较大幅度的提升。(3)基于上一项工作提出的混合BNSL算法,设计了一套基于食品样品检测数据的食品安全事故原因分析方法,包括:将检测数据转化为训练数据的预处理及特征工程方法;基于BN模型的事故原因分析及风险预测方法;最后提出了一个有关食用油安全风险的BN数据集。通过以上流程将BNSL算法应用于实际,实现了由结构化检测数据到利用BN进行风险预测的全流程分析方法。综上所述,本文针对基于GA的混合结构学习算法进行了两部分工作,分别从结构信息和互信息角度入手优化了算法的性能和效率;为食品安全事故分析和风险溯源提供了一套基于BN的解决方案;最后提出了一个BNSL数据集,可用于后续的算法研究。
其他文献
【目的】探讨菌草栽培灵芝的理论依据和实践模式。【方法】分别以木屑、五节芒、芒萁、巨菌草等为栽培原料熟料袋式栽培灵芝,研究灵芝菌丝满袋时间、原基形成时间、生物转化率及营养成分,比较不同菌草和木屑栽培灵芝生长情况。采用国标通用方法对灵芝子实体营养成分、氨基酸成分和重金属含量进行测定,比较不同栽培原料对灵芝子实体营养成分的影响。【结果】4种配方的菌丝满袋时间和原基形成时间无显著差异,配方C(五节芒48%
<正>在全球红树林持续减少的态势下,我国红树林面积增至2.9万公顷,“海岸卫士”呈现生机勃勃的发展趋势。6月8日是世界海洋日,今年世界海洋日主题是“保护红树林 保护海洋生态”。自然资源部及国家林业和草原局发布最新数据显示,通过持续加大红树林资源保护修复力度,全面恢复提升红树林湿地生态功能,20年来我国红树林面积增加7000公顷,成为世界上少数几个红树林面积净增加的国家之一。目前我国55%的红树林湿
期刊
信息披露是债券市场发展过程中不可或缺的一环,也是市场稳健运行、防范风险的重要保证。近年来,我国不断加强和完善地方政府债券管理,积极财政政策效能持续发挥。但从地方政府债券信息披露角度来看,仍存在配套制度不尽完善、信息披露质量有待提升等情况。本文对比分析不同国家间信息披露制度的差异,聚焦信息披露要素,提出中国地方政府债券信息披露的优化路径,促进地方政府债券更好地服务于高质量发展。
红树林作为热带和亚热带海岸带上特有的森林群落,具有独特的生态功能以及重大的社会、经济价值。中国红树林经历了反复的破坏与保护,遥感监测手段可以为实施大规模的红树林生态系统保护和恢复行动提供科学技术支撑。本研究依托Google Earth Engine平台提出一种时空概率阈值法对中国红树林范围进行提取。研究选取2015年516景Landsat 8数据,首先使用非监督分类法进行水陆分离,其次通过生成缓冲
从站城一体视角入手,梳理地铁建设中地下遗存展示现存的"‘站-城’文化脱离""规划设计被动""空间属性丢失"3大问题,并对国内外相关先驱性案例归纳分析,提出"一体化展示利用"理念,总结出"多元融合的新型城市综合体""与地上一体化开发的城市文化微中心"和"展陈小型遗址或出土文物的考古车站"3种展示利用设计策略。并在适用对象、空间组织、功能布局和展陈方式等方面展开探讨,希望为缓解地铁建设与地下遗存展示利
目的:采用网状Meta分析评价6种扶正类中成药治疗儿童咳嗽变异性哮喘的临床疗效。方法:计算机检索PubMed、Web of science、中国期刊全文数据库、万方数据库、维普中文期刊服务平台中扶正类中成药治疗儿童咳嗽变异性哮喘的随机对照试验,检索时限为建库至2021年12月10日。采用Cochrane偏倚风险评估工具对纳入文献进行筛选和质量评价,运用Rev Man 5.4和Stata16.0进行
氮素是植被整个生命周期的必要元素,红树林冠层氮素含量(CNC)遥感估算对红树林健康监测具有重要意义。以广东湛江高桥红树林保护区为研究区,本文旨在基于Sentinel-2影像超分辨率重建技术进行红树林CNC估算和空间制图。研究首先基于三次卷积重采样、Sen2Res和SupReMe算法实现Sentinel-2影像从20 m分辨率到10 m的重建;然后以重建后的影像和原始20 m影像为数据源构建40个相
对印刷电路板式换热器(PCHE)流道布置方式进行优化,可进一步提高其体积紧凑度和功率密度。本研究根据PCHE具有类翅片结构特征,将传统板式布置方式改进为胞元结构布置方式,通过增加冷热流体温度场协同性来进一步提升PCHE的换热性能;并利用数值模拟方法分别对传统板式布置方式和胞元结构布置方式的PCHE作为超临界二氧化碳布雷顿循环中的冷却器和钠冷快堆余热排出系统中的直接热交换器的热工水力性能进行对比研究
红树林物种遥感分类受影像分辨率、波段信息、分类策略、影像特征选择方法等因素影响。现有的红树林物种遥感分类研究大多关注于分类精度的比较,较少报道商业高分与国产高光谱卫星的结合在物种分类的应用。基于湛江高桥红树林保护区的高分(WorldView-2)和高光谱(珠海一号)卫星影像,本文旨在利用随机森林分类方法,比较不同特征选择算法(极端梯度提升(XGBoost)、极端随机树(ERT)、连续投影算法(SP