论文部分内容阅读
城市轨道交通运营突发事件案例,是一种用文本描述的非结构化历史数据,描述了城市轨道交通运营突发事件发生发展过程,其中包含了事件的构成要素和事件状态变化信息。利用从城市轨道交通运营突发事件案例中自动抽取出的事件信息以及事件的发展过程信息,构建描述城市轨道交通运营突发事件演化规律和发展逻辑的关系图,能够结构化的还原城市轨道交通运营突发事件的演化过程,从而可以发现城市轨道交通运营突发事件演化过程的特点,便于更好的理解和把握事件发展趋势;同时为应急管理领域的专家学者提供事件演化信息数据的支持,以便面对城市轨道交通运营突发事件时正确快速做出应急决策活动,加强城市轨道交通运营安全。为此,本文主要研究城市轨道交通运营突发事件的事理图谱构建。针对从新闻网页得到的城市轨道交通运营突发事件案例,首先定义了城市轨道交通运营突发事件概念体系,其中包括事件定义、事件类型定义和事件关系定义等,并基于此进行了语料标注,然后利用自然语言处理技术完成事件信息与事件关系的自动化抽取,之后利用不同可视化类数据库对已获得的数据进行存储并进行城市轨道交通运营突发事件事理图谱的生成,即可视化展示。主要的工作内容如下:(1)针对城市轨道交通领域缺少专用事件案例库的问题,本文将从新闻网页收集的城市轨道交通运营突发事件案例,进行数据去重去噪以及数据融合后,构建了城市轨道交通运营突发事件语料库。并且根据城市轨道交通运营突发事件案例描述特点,结合专家知识,定义了城市轨道交通运营突发事件相关概念体系,定义了自然灾害类、社会安全类、事故灾难类、施工类、其他事故类5种事件类型;同时,本文还提出了“非实体类事件元素”的概念,对每种事件类型定义了地点、时间、车辆状态、线路情况、站点状况、交通影响、伤亡、人员滞留情况、财产损失9种实体类和非实体类事件元素角色;并且定义了4种事件关系类型,包括转折、条件、因果和顺承关系。最后,基于定义的概念体系对城市轨道交通运营突发事件案例进行标注。(2)针对城市轨道交通运营突发事件案例描述中,事件密度高且事件元素分散的问题,结合城市轨道交通运营突发事件相关概念体系里定义的事件类型以及事件元素角色,构建了文档级城市轨道交通运营突发事件抽取模型,研究从整篇案例描述中识别城市轨道交通运营突发事件类型以及事件包含的元素信息。模型整体看作序列标注模型,对标注的城市轨道交通运营突发事件案例文本进行文档向量化后,采用卷积神经网络(CNN)提取序列文本中融合上下文语义信息的词级别特征,接着通过双向长短时记忆网络(Bi LSTM)获取序列文本的上下文特征,然后引入注意力机制(Attention)突出序列文本的关键语义信息特征,完成城市轨道交通运营突发事件触发词识别,得到事件类型,对融合识别出的触发词的特征的城市轨道交通运营突发事件案例标注文本,采用基于注意力机制的双向长短时记忆网络(Bi LSTM-Attention)获取序列文本的上下文语义信息,然后通过条件随机场(CRF)获得序列标注结果,实现城市轨道交通运营突发事件元素识别,完成城市轨道交通运营突发事件抽取。实验结果表明,与提出的基线方法相比F1值分别提高了4.65%(触发词识别)和11.76%(事件元素识别)。(3)根据城市轨道交通运营突发事件概念体系里定义的事件关系类型,以及关系连接词划分方法,构造出事件间、事件元素间以及事件和事件元素间的三元组表示,针对三元组存在元素重叠的问题,提出基于预训练模型BERT的城市轨道交通运营突发事件关系抽取模型,利用预训练模型BERT学习事件案例标注文本的上下文语义信息,然后识别出事件案例中的首元素,最后识别出首元素所有可能的相关关系以及该关系对应的尾元素,实现城市轨道交通运营突发事件关系抽取。实验结果表明,与提出的基线方法相比F1值提高了13.29%。(4)利用Neo4j图数据库和protégé本体开发工具,将通过城市轨道交通运营突发事件抽取以及关系抽取获得的事件信息,事件元素信息以及关系信息进行存储,并进行城市轨道交通运营突发事件事理图谱可视化展示。图30幅,表19个,参考文献71篇。