基于语义特征的事故隐患智能化分类方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xjp_djx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的进步,安全生产监管工作逐步向智能化的领域快速发展。作为安监整体部署的重要一环,事故隐患的分类任务关系到分析当前各区域监管重点,以及优化下一阶段各区域监管部署。最终实现从事后被动反应向事前主动监管的方向转变。在现有的工作模式下,安全员以北京市安全生产事故隐患分类规范为分类基础,将事故隐患与分类标签一一对应。但是,同司法领域的“一人多罪”场景类似,部分事故隐患在分类规范下符合多个隐患类别的特征,现有事故隐患与标签一一对应的方式未能全面反应事故隐患的严重程度。为了直观反应事故隐患的严重性和关联性,需要从文本语义特征提取的角度出发,实现对于单一事故隐患的多标签分类,构建面向安全生产领域的智能化分类模型。本文以2018年北京市安全生产事故隐患数据为研究对象,从文本语义特征的角度出发,结合深度学习模型和文本相似度计算,构建事故隐患多标签分类模型,真实反映事故隐患对应的标签数量和名称,有利于执法人员分析重点隐患,合理优化工作部署。本文具体的工作内容如下:(1)多标签分类理论研究。针对单标签文本分类与多标签文本分类任务进行基础理论研究,研究现阶段的分类方法和思路,并结合当前的应用场景进行分析。(2)事故隐患智能化粗分类模型构建。对于标签组合总量少、共现程度高的4种大类事故隐患,通过构建标签组合的方法,将多标签分类问题转化为多分类问题。结合文本语义特征构建混合文本向量,在TextCNN基础模型中引入注意力机制,构建面向4大类事故隐患的粗分类模型。(3)事故隐患智能化细分类模型构建。对于标签组合总量多、标签共现程度较低的26种小类事故隐患,通过采用Seq2seq的模型结构,结合事故隐患文本的词语和段落特征,在层次注意力网络模型的基础上进行改进。利用LSTM(Long Short Term Memory)单元代替GRU(Gated Recurrent Unit)单元,并将句子级注意力机制层引入解码器。通过两种改进方式,提升模型的解码效果。本文针对事故隐患4大类和26小类两类标签数据集分别构建多标签分类模型。在事故隐患智能化分类任务中,相较于基准模型,两种改进后的模型均提升了模型的准确率、召回率。实验结果能够证明改进后的层次注意力机制模型有效提升了多标签分类模型的分类效果。
其他文献
改性无机粉复合建筑饰面片材(仿古青砖MCM片材)作为新型无机高分子材料,在旧城改造中的应用越来越广泛.嘉兴市“一环四路”旧城外立面改造项目通过应用仿古青砖MCM片材,还原了历史文化名城的风貌,达到良好改造效果.采用电镜扫描仪、X射线衍射仪、同步热分析仪分析了仿古青砖MCM片材微观形貌、矿物组成及热学性能,验证了仿古青砖MCM片材具有高分子材料柔韧性.
深圳国际会展中心地下车库采用非金属骨料耐磨地坪,为保证超长、超大面积耐磨地坪不开裂,对耐磨地坪开裂原因进行分析,对非金属骨料耐磨地坪基层处理、弹线分仓、墙柱隔离缝施工、特殊部位补强处理、钢筋网片固定、分隔缝切割等关键工艺进行控制.通过从原材料、设计、施工方面采取裂缝控制措施,包括优化混凝土配合比、增加钢筋网片、提高细部节点施工质量等,可最大程度地减少或避免非金属骨料耐磨地坪开裂.
问答系统能识别人类以自然语言形式输入的问题,并且以高度精练、准确的自然语言,迅速地回答人类的问题。相比于传统的信息检索系统,问答系统的用户不需要使用诸如关键字之类的不自然的形式来检索信息,而且问答系统给出的答案也不是包含大篇幅文本的网页或文档,而是针对具体问题的、较为精练准确的、以自然语言形式组织的答案。问答系统在许多领域中已经发挥出较大的作用,但仍有其不足之处。在问答系统的设计方式上,基于常见问
EFS土壤固化剂为新型固化材料,作为道路基层建设材料,具有较好的经济、环境效益,在实际工程应用中应考虑不同土体与岩体的特殊性,对固化土长期强度进行试验研究.以黑砂土、黄砂土、风化砂土、盖山土为基料,开展不同龄期无侧限抗压强度试验.研究结果表明,随着养护龄期的增加,固化土试件无侧限抗压强度总体呈增大趋势,但试件失去承载力时表现为脆性破坏;固化土试件无侧限抗压强度与养护龄期线性关系较明显;黑砂土试件无侧限抗压强度可满足道路下基层强度规范值要求,黄砂土、风化砂土、盖山土试件无侧限抗压强度可满足道路上基层强度规范