论文部分内容阅读
群体追逐是一种经典的群体间博弈运动,指的是两种或多种不同类型的个体之间进行彼此追逐的集体性流式运动现象。群体追逐运动来源于真实的自然界场景,早期因为自然界中普遍存在的动物捕猎行为而吸引了大量学者的关注,目前群体追逐运动的研究也已经渗透到恐怖袭击演练、人群疏散等多个领域。在群体追逐过程中,群体之间的行进轨迹和动力学规律都和参与者采取的策略息息相关。探究群体追逐中参与方的不同策略选择,并优化其动态决策的过程,在很多场景下都具有普遍的现实意义,比如人群疏散的智能疏导过程。在传统的人群疏散场景中,一般来讲只存在着一种类型的角色(即疏散人群),通常对这样的场景进行仿真只需要考虑路径寻找问题和碰撞避免问题。而在本文的模型设计中,疏散过程中对行人具有巨大威胁的移动攻击者也被考虑在内,即形成了群体追逐条件下的人群疏散环境。尽管恐怖袭击事件发生的概率很小,对存在移动攻击者的疏散环境进行建模仍然具有一定的防范作用和研究价值。本文将主要对群体追逐场景下的人群疏散进行建模仿真,将疏散的地点设置在了西单大悦城一楼的复杂室内环境中,以此建立了一个连续空间的疏散模型。在本文所设计的模型中,群体追逐场景下的人群需要完成躲避攻击者和撤离到安全出口两个任务,有时两者可以同时完成,有时则会产生矛盾,这时需要在两者之间进行权衡。基于这样的假设,本文研究了行人在兼顾快速撤离和躲避危险的情形下,整个疏散过程的总体耗费时间和伤亡人数。本文通过多次的实验发现:群体追逐场景下的行人决策对疏散结果的影响至关重要,而人为设定的简单策略往往达不到很好的疏散效果。因此本文又结合了深度强化学习算法,利用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)网络、双向协调网络(Bidirectionally-Coordinated Nets,BicNet)等模型对行人的决策过程进行了优化,让疏散行人根据疏散过程中出现的具体场景做出智能决策,提高了室内疏散的效率,减少了总体的疏散时间和伤亡人数。