基于约束的高效局部贝叶斯网络结构学习算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:vicky88337402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络是不确定性知识表达与推理的重要工具,是数据挖掘、人工智能和机器学习等领域中的重要研究方向之一。在大数据时代,由于数据的高维度,学习整个贝叶斯网络结构是一个耗时甚至不可能在有限时间内完成的任务,这使得学习一个给定变量的局部贝叶斯网络结构成为一个新的探索方向。然而目前的局部贝叶斯网络结构学习算法仍存在很多问题需要进一步探索,因此,本文开展基于约束的局部贝叶斯网络结构学习算法的相关研究,主要取得了如下创新性成果:(1)针对现有的局部结构学习方法在构建骨架时因不可靠的条件独立性(Conditional Independence,CI)测试导致边被错误连接的问题,本文提出了一种改进的局部贝叶斯网络结构学习算法(ICSL)来解决上述问题。该算法在构建局部骨架过程中检测边连接是否存在错误的情况,即丢失正确的边或增加错误的边,并且采取一种收敛的策略来尽可能正确地连接边,然后重新追踪已检测的变量以减少错误的定向,从而提升了算法的局部结构学习的效果。实验结果表明,ICSL算法比其它已有的局部结构学习算法有更好的学习精度。(2)针对现有的局部结构学习算法存在执行大量冗余CI测试的问题,本文提出了一种基于CI测试缓存表的PC(Parents and Children)学习框架(CTPC),在确保算法原有的准确性的前提下,通过减少冗余CI测试来提升局部贝叶斯网络结构学习的效率。具体而言,本文首先设计一个CI测试缓存表和CCT_select算法来存储CI测试。对于已经计算过的CI测试,则直接从CI测试缓存表中获取测试结果,而不是再次计算这些测试。若缓存表中没有该次CI测试,则计算这个CI测试并按一定压缩规则将其存储在表中。基于该缓存表以及现有的PC学习策略,本文提出了两个可以加速局部结构学习的CTPC框架并实例化现有的局部结构学习方法,提高这些方法的效率。同时,本文将该局部结构学习加速框架推广到全局结构学习中,成功实例化并加速现有的局部-全局结构学习算法。通过大量的实验证明,CTPC框架可以显著地加速现有的局部和局部-全局贝叶斯网络结构学习算法,同时不会牺牲算法的准确性。
其他文献
伴随着互联网技术的快速发展,网络购物已经逐渐成为了人们生活中不可或缺的一部分,国内网上购物平台的兴起也进一步导致中文商品评论文本数据的大量产生,这些评论文本数据中往往包含着大量的情感信息,因此如何分析应用这些信息无论对于企业、个人还是国家都有着重要的研究意义。本文在首先介绍了中文商品评论情感分析的研究背景和意义、国内外研究现状和相关的理论基础知识后,着重研究中文商品评论的情感分析。本文的主要研究工
学位
随着物联网技术的飞速发展,出现了大量的物联网异构设备的共存问题,也产生了不同协议的无线设备之间互相通信的需求。传统的方法是利用物联网网关,物联网网关配备了多个无线接口,为不同技术进行协议转换,实现异构物联网设备之间的间接连接。然而,物联网网关需要接收和发送不同的信号,引入了额外的硬件成本和信道资源占用。因此,研究者提出了跨协议通信技术(CrossTechnology Communication,C
学位
旋转设备故障诊断是保证设备可靠运行的重要研究内容,轴承复合故障诊断由于其特征高度耦合,故障类型繁多,是故障诊断中的难点问题。现有的复合故障诊断方法多需要获取大量的复合故障样本进行信号分析或者模式识别,考虑到实际工况中,轴承的单一故障样本比较容易采集和标注,但复合故障的样本却难以获取且难以标注。本文从单一故障样本与标签的约束条件入手,研究复合故障样本识别的新方法,提出基于零样本嵌入模型的复合故障诊断
学位
骨龄评估(Bone Age Assessment,BAA)作为儿童健康成长的重要组成部分,可以直接反映出儿童的生长发育情况,得到了人们的广泛关注。儿童骨骼的生长发育过程是连续的、阶段的,并具有具有一定的规律性。因此,专家可以利用手部X光片判断出儿童骨骼的生长发育情况,并对遗传性和内分泌疾病进行相关诊断。此外,骨龄评估还可以用于特殊人才的选拔和作为罪行推定的依据,在体育、法律等领域也发挥着重要的作用
学位
在人工智能广泛应用的今天,对话系统作为自然语言处理的一大分支,或已成为衡量人工智能发展程度的一大标准。在对话系统的发展过程中面临着多种困难,如在多轮对话生成工作中如何将对话的历史信息更好的在生成中体现以及在对话生成过程中如何避免主题缺失等现象。在本文的研究中,旨在解决在开放域多轮对话生成过程中缺乏上下文信息和主题缺失的问题,论文研究了一种基于层次注意力机制的上下文主题对话模型。本文的主要工作如下:
学位
在EAST托卡马克装置上,采用了多种可见光光学诊断设备监控等离子体的状态。为了保证这些光学诊断设备的准确性,需要对其光束空间方向进行校准,而在狭窄的真空室内进行人工校准是不可接受的。为了解决这个问题,本文设计一种基于视觉伺服的光束定向系统。将一个专用的相机采集模块安装在新松GCR5-910机器人的末端,用于获取光斑中心点的像素坐标,经过坐标变换和空间直线拟合算法拟合出光束的空间方向。同时使用视觉伺
学位
近年来,区块链技术越来越受关注,区块链技术也得到了多方面的发展。但是,区块链面临低吞吐量和低存储扩展性的瓶颈。分片技术可以提高区块链的并发吞吐能力,但现有的交易分配方法不能有效提高区块链的收益。多副本区块方法为一个数据块设置多个副本,并将每个副本存储在不同的节点中,相比区块的全复制方法,多副本方法有效降低了节点的存储开销。但现有的区块链多副本方法忽略了区块的查询代价。针对这些问题,本文分别研究面向
学位
托卡马克核聚变堆在运行的时候会产生大量热能、辐射能、电磁场以及中子流,多数情况下都无法进行人工维护。因此需要使用遥操作控制系统对托卡马克装置内部进行维护和操作。在遥操作上层控制系统中需要采集多种数据来对任务进行创建。采集机械臂数据可通过示教来进行,将数据存储到遥操作上层控制系统的运行管理子系统数据库中。但示教采集信息的方式效率低,在目标位置发生变化后就要重新示教,而且在聚变堆运行后装置内部情况不允
学位
多标签特征选择在高维多标签学习任务中起着至关重要的作用,并被广泛用于文本分类,Web数据挖掘等领域。现有的多标签特征选择方法主要是探索特征-标签、特征-特征和标签-标签的相关关系中的两种,少数方法能够同时处理三种类型的相关关系。如果能够同时考虑三种相关关系,可以获得带有更多辨识信息的特征子集,用于构建性能更加优越的预测模型。为了解决这个问题,本文将多标签特征选择问题转化为局部因果结构学习问题,围绕
学位
知识图谱是一种用来描述现实世界实体之间相互关系的知识库,其已在搜索、推荐和问答领域得到广泛的应用。大规模的知识图谱难以完全依靠人工构建,因此自动化的构建知识图谱成为了研究的热点问题,其中命名实体识别是构建知识图谱的基础任务之一。目前,基于Transformer的预训练语言模型在解决命名实体识别任务上得到广泛的应用,但这类方法通常需要高质量的标记数据进行微调,难以在无监督或弱监督的情况下实现较好的命
学位