状态翻转控制下布尔控制网络的可镇定性和Q学习算法

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:qinchuanhedian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在给定一个子集的条件下,本文研究了在状态翻转控制下布尔控制网络的全局镇定问题.对于节点集的给定子集,状态翻转控制可以将某些节点的值从1(或0)变成0(或1).将翻转控制作为控制之一,本文研究了状态翻转控制下的布尔控制网络.将控制输入和状态翻转控制结合,提出了联合控制对和状态翻转转移矩阵的概念.接着给出了状态翻转控制下布尔控制网络全局稳定的充要条件.镇定核是最小基数的翻转集合,本文提出了一种寻找镇定核的算法.利用可达集的概念,给出了一种判断全局镇定和寻找联合控制对序列的方法.此外,如果系统是一个大型网络,则可以利用一种名为Q学习算法的无模型强化学习方法寻找联合控制对序列.最后给出了一个数值例子来说明本文的理论结果.“,”In this paper, the global stabilization of Boolean control networks under state-flipped control with respect to a given subset is addressed. For a given subset of the set of the nodes, the state-flipped control can change the values of some nodes from 1 or 0 to 0 or 1. Considering the flips as controls, Boolean networks under state-flipped control are studied. Combining control inputs with state-flipped controls, the concepts of joint control pair and the state-flipped-transition matrix are proposed. A necessary and sufficient condition is provided to check whether a Boolean control network under state-flipped control can be globally stabilized. An algorithm is developed to find the stabilizing kernel, which is the flip set with the minimal cardinal number. By using the reachable set, another method is provided for global stabilization and joint control pair sequences. Besides, if the system is a large scale network, a model-free reinforcement learning method called Q-learning algorithm, is used for the joint control pair sequences. A numerical example is given to illustrate the theoretical results.
其他文献
为精细探测浅部煤层采空区分布范围,在相移法中引入低频聚焦因子,提出一种低频聚焦型相移法,其具有在短接收排列上提取低频频散能量的优势.模拟结果表明:该方法显著改善了频散能量在低频端的聚焦性,扩展了可拾取的频带范围,增大了探测深度,缩短了计算频散能量所需的排列长度,提高了面波多道分析方法(MASW)的横向分辨率.浅部煤层采空区实测试验结果表明:采用低频聚焦型相移法提取频散能量,通过MASW方法获得了高精度的横波速度水平切片,可以清晰识别出采空区范围、保安煤柱位置及其几何形态.证实了低频聚焦型相移法可提高MAS
利用煤岩学、矿物学和地球化学等研究方法,在分析准格尔煤田的构造背景和聚煤环境的基础上,研究了准格尔煤田6号煤层的煤岩煤质特征、煤和夹矸中无机矿物组成、分布及赋存特征,并探讨其成因.研究表明,6号煤层有机显微组分中惰质组、镜质组、壳质组平均含量分别为59%、28%、13%,与华北其他地区晚古生代煤相比,其中的惰质组含量偏高,反映6号煤层形成时地表水供给充分;煤中无机显微组分及夹矸中主要矿物为高岭石和勃姆石,还有少量的石英、方解石、菱铁矿、黄铁矿、硬石膏、锐钛矿和磷锶铝矾等;6号煤层中部富集大量勃姆石,上部和
小断层是影响煤矿安全高效开采的重要因素.近年来有关小断层的地震波识别方法取得了长足的进步,但对煤田落差5m以内小断层的识别仍是一大难点.南方煤田一般地形复杂、断裂发育,为推进南方煤田小断层的地震勘探研究,本文选取南方典型煤田——贵州省六盘水煤田作为研究区,通过建立煤系地层地震物理模型进行地震数据采集、处理与解释,从地震波运动学和动力学的角度对不同埋深落差分别为5m、3m和1m的小断层进行识别.研究结果表明:由于煤层处于地表低速层,对于落差1~5m的小断层采用地震波运动学方法难以识别,而应用动力学方法提取多
为庆祝中国自动化学会控制理论专业委员会(TCCT)成立60周年, TCCT委员会在《控制理论与应用》期刊组织“控制理论专业委员会(TCCT)60周年”专刊,介绍当前控制理论与应用的前沿热点,展示TCCT专委会的最新研究成果.
期刊
近年来,随着大规模网络的兴起和分布式优化理论的广泛应用,矩阵方程的分布式求解算法研究也受到了越来越多的重视.矩阵方程的计算求解在理论和工程领域都有着重要的意义.在多智能体网络下的分布式计算问题中,矩阵方程中的数据信息按照各种方式进行划分,单个智能体只能够获取其中的一份数据,然后通过与其邻居智能体进行信息交互,最终合作求解出不同类型的符合方程要求的解.本文集中讨论了近几年来针对线性代数方程、几类不带约束和带约束线性矩阵方程、以及其他矩阵相关的分布式计算和求解问题,介绍了投影一致方法、转化成分布式优化问题再求
本文研究了一类具有不确定非线性动力学和未知外部扰动的二阶非线性系统的全局有限时间输出镇定问题.首先,提出了一种全局状态反馈有限时间控制器,实现了二阶非线性系统的有限时间镇定.为了解决只有系统输出可用这种更有挑战性的情况,采用了一种新颖的设计思想,即非分离原理.构造了一个有限时间收敛的状态观测器来估计未知状态.在此观测器的基础上,提出了一种基于输出的有限时间复合控制器.基于李雅普诺夫方法,证明了整个闭环系统的全局有限时间稳定性.仿真结果表明了理论的有效性.
针对一类具有任意相对阶且带有部分非输入到状态稳定逆动态的非线性切换系统,提出一种动态事件触发漏斗跟踪控制方案.首先,引入一个虚拟输出将任意相对阶的非线性切换系统转换为相对阶为一的非线性切换系统.其次,设计各子系统的事件触发漏斗控制器和切换的动态事件触发机制,解决候选事件触发漏斗控制器和子系统之间的异步切换问题,所提方案消除已有文献中为所有子系统设计共同控制器带来的保守性.在一类具有平均驻留时间切换信号的作用下,保证切换闭环系统的所有信号都是有界的,且跟踪误差一直在预设的漏斗内演化,并排除采样中的奇诺现象.
具有可数状态空间的马尔可夫决策过程(Markov decision process,MDP)在平均准则下,最优(平稳)策略不一定存在.本文研究平均准则可数状态MDP中满足最优不等式的最优策略.不同于消去折扣(因子)方法,利用离散的Dynkin公式推导本文的主要结果.首先给出遍历马氏链的泊松方程和两个零常返马氏链的例子,证明了满足两个方向相反的最优不等式的最优策略存在性.其次,通过两个比较引理和性能差分公式,证明了正常返链和多链最优策略的存在性,并进一步推广到其他情形.特别地,本文通过几个应用举例,说明平均
本文提出了一种基于主动学习的增强模型预测控制方法.该方案克服了大多数基于学习的方法的缺点,即只能被动地利用可获得的系统数据并导致学习缓慢.首先应用高斯过程来评估残差模型的不确定性并构建多步预测模型.然后提出了一个两阶段主动学习策略,通过在优化问题中引入信息增益作为对偶目标来激励系统探测.最后,基于鲁棒不变集定义了安全控制输入集保证了状态约束满足与系统安全性.本文提出的方法在保证系统安全的情况下提高了学习能力和闭环控制性能,实验说明了本文方案的优越性.“,”This paper proposes an ac
量子神经网络结合了量子计算与经典神经网络模型的各自优势,为人工智能领域的未来发展提供了一种全新的思路.本文提出一种基于参数化量子电路的量子卷积神经网络模型,能够针对欧几里得结构数据与非欧几里得结构数据,利用量子系统的计算优势加速经典机器学习任务.在MNIST数据集上的数值仿真结果表明,该模型具有较强的学习能力和良好的泛化性能.