论文部分内容阅读
智能交通信号灯系统(I-SIG)正受到越来越多的关注,实际应用中的I-SIG系统在提升交通运行效率方面已经取得了良好的示范效果,正迈入新一轮研究创新与实施落地的快速发展阶段。而随着针对I-SIG系统的数据投毒攻击研究的出现,I-SIG系统的安全问题进入研究人员的视线,如何针对数据投毒攻击提供有效的防护,成为一个需要迫切解决的问题。由于I-SIG系统的组成涉及了自动驾驶汽车、智能信号灯控制系统以及承载数据与控制指令的通信网络,这些都有可能受到恶意攻击。论文重点针对自动驾驶汽车和智能信号灯控制系统所受到的投毒攻击进行分析和防护方法研究。一方面,I-SIG系统中的智能汽车应用了图像识别、语音识别及路径规划等多项人工智能(AI)技术,而最近的研究表明经过特殊设计的对抗性样本能够使图像识别和语音识别系统产生错误的输出,可能造成危险的撞击事故,这对自动驾驶汽车的安全行驶是一个很大的威胁。显然,这种攻击也可能被引入到智能汽车的路径规划应用中,论文针对强化学习具有代表性的学习方法Q-Learning实现的路径规划系统研究对抗性攻击与防护问题。论文提出一个对抗性样本预测模型,同时给出了相应的防御技术。模型基于对抗特征及其相应的权重来预测对抗性样本,通过对能量点引力、关键点引力、路径引力、夹角和平和点等五个对抗特征的计算,构建了一个自然的线性模型去结合对抗特征价值与权重,并且基于主成分分析(PCA)来计算权重参数。通过大量的实验验证了所提出模型可以做出令人满意的预测,经过适当的参数设置,模型的精确度可以达到70%。另一方面,最新的针对I-SIG系统中信号灯控制系统的数据投毒攻击研究,使得智能信号灯规划系统的安全问题显露无疑。攻击者通过发送错误的车辆实时速度和位置数据给智能信号灯规划算法(COP),触发信号灯规划算法的决策失误导致交通拥堵甚至全局交通瘫痪。针对信号灯规划系统的污染数据投毒攻击提供有效的防护,论文提出了引入模型无关的强化学习Q-Learning方法对COP进行扩展加固,从而在一定程度上减轻污染数据投毒攻击对信号灯规划算法COP的不良影响。通过构建状态空间、离散动作空间以及面向状态变化的奖赏函数,构建了Q-Learning—COP加固模型。通过在美国交通部最新开源平台MMITSS1上模拟复现了对COP的污染数据投毒攻击实验,并利用提出的加固模型对数据投毒攻击进行了防护实验。防护后的车辆总延迟相比防护之前下降了 20%左右,表明模型具有较好的防护效果。