基于多特征LSTM-Self-Attention的煤矿安全隐患情感分类研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:songchuans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国煤矿安全生产的形势不断好转,但与发达国家相比还是具有较大的差距。为了我国煤矿生产的不断优化发展,国家出台了一系列相关的安全生产政策,发布了统一的煤炭行业安全生产隐患信息标准,但随着煤矿生产的不断开展,煤矿安全隐患数据与日俱增,又带来了一系列新的问题,一方面如何高效准确地的分析这些海量的数据,而这些海量的数据中文本型的数据包含了丰富的内容没有得到有效的挖掘,另一方面现有的方法都是采用人工方式对煤矿安全隐患进行分级,造成分级结果不够科学和严谨。针对上述问题,本文做了如下研究:本文着眼于文本型的煤矿安全隐患信息,对其进行情感分析,以基于深度学习的方法为基础,构建了基于多特征LSTM-Self-Attention和基于BERT的LSTM-Self-Attention两个文本情感分类模型,实现煤矿安全隐患信息情感自动分类的任务。在基于多特征LSTM-Self-Attention文本情感分类模型中,首先,人工构建了煤矿安全隐患信息专有词库,然后使用了传统文本情感分类的文本预处理方法,并且在传统的输入特征中加入了词性特征,接着使用Word2vec模型训练成计算机能识别的向量信息,最后利用LSTM网络模型提取文本的序列特征,并通过在模型中引入自注意力机制(Self-Attention),从序列特征中提取出句子的语法和语义特征,减少了任务的复杂度。在基于BERT的LSTM-Self-Attention文本情感分类模型中,首先,直接将文本使用BERT模型训练成向量信息,该模型解决了一词多义的问题并全面的表示了文本的特征。接着使用LSTM模型来提取特征,并且加入了Self-Attention来进一步提取远距离的特征,最后使用分类器进行分类,实现了文本情感分类任务。本文提出的两个模型有效避免了传统循环神经网络存在的梯度消失和梯度爆炸的问题,极大缩短了单词长距离依赖特征之间的距离,提高了分类效果。结果表明该方法特征提取能力更强,使得情感分类的准确率得到了提升。
其他文献
随着网络视频逐步成为人们上网流量的重要组成部分,视频的码率自适应(Adaptive Bitrate,ABR)也逐渐成为视频传输播放的一项基本能力。作为提升用户观看体验的核心要素,它也越来越受到广大视频提供商的重视。然而传统的码率自适应算法设计时对平台没有要求,因此没有考虑视频播放终端设备的电量、位置等状态因素带来的特殊性,从而无法给用户最佳的观看体验。本文针对传统的码率自适应算法的不足之处,提出了
目的:通过Meta分析探讨在椎弓根螺钉内固定术中,与传统的C型臂(C-arm)透视下置钉方式相比,O型臂(O-arm)导航辅助下置钉方式在置钉准确率和效率方面,以及术中辐射剂量和术后并发症发生率等方面的优劣情况。方法:从Pubmed,Cochrane Library,Embase,Medline,中国生物医学文献数据库(CBM)、中国期刊全文数据库(CNKI)及万方医学等数据库中,检索2006年1
我国广大农村是贫困发生率最高的地区,这里拥有超过40%的人口却仅占有20%的国内生产总值。农村地区经济发展动力不强、后劲不足是我国农村目前面临的难题。以习近平为核心的党中央,坚持以人为本,把扶贫工作放在更加突出的位置,大力实施精准扶贫、精准扶贫的基本方针,政府针对贫困地区的投资力度不断加大,投资领域不断拓展,对广大贫困地区的扶贫投资促进了我国产业结构、能源消费结构以及消费总量的协同变化。因此,本文
红色文化遗址资源是在中国共产党领导人民进行反帝反封建革命斗争中形成的宝贵财富,是革命历史和红色文化的物质载体,记载着党领导人民进行民族独立、人民解放和国家富强的历史,承载着伟大的革命精神和优良的革命传统,是党和人民战胜困难、不断取得新胜利的动力来源,具有重要的政治、经济、文化等价值,有效地对其进行保护与开发对社会发展起着积极的作用。2012年习近平总书记提出文化自信,并数次来到红色文化遗址进行调研
轨道的健康状态是保障列车安全、平稳运行的基本前提,目前我国铁路与城市轨道交通采用静态检查与动态检查相结合的方式对轨道状态进行检查,便携式线路检测仪是其中一种重要的线路检测设备。便携式线路检测仪的数据处理上还存在大量不足,其中里程漂移是目前轨道动态检测数据中最为常见的数据质量问题之一。为解决里程漂移问题,本文采用一种基于惯性传感器组件的新型便携式线路检测仪,围绕城市轨道交通线路检测数据的里程计算及校
随着云计算技术的不断成熟,信息技术领域围绕云计算技术展开的软硬件应用与部署日益广泛,企业运用云架构产品和服务也越来越多,企业的信息技术运营“云”化已然成为一种趋势。基于桌面云技术在证券期货业内的推广,本论文以上海证券交易所在用桌面云系统为典型案例,综合分析了证券期货业通用桌面云系统应用场景。通过分析上海证券交易所在用桌面云系统桌面云在运营过程中出现的风险,对证券期货业桌面云环境的网络传输、终端安全
基于SPAC理论,通过对日光温室滴灌条件下的番茄进行不同灌水量的灌溉试验,灌水量分为四个处理:T1,100%ET_0;T2,85%ET_0;T3,70%ET_0;T4,55%ET_0,进一步分析根阈土壤含水量消退规律,掌握作物生理响应特征,获取温室农田环境气象参数,深入探索土壤-作物-环境与番茄需水规律内在联系,筛选适宜于温室番茄的灌溉决策指标,并建立多数据融合的灌溉决策模型,并取得了以下研究结果
液压支架护帮板是综采工作面的一种保护装置,用来保护裸露的煤壁和顶板,防止冒顶片帮伤亡事故的发生。因此,对护帮板状态的检测显得尤为重要,但传统护帮板状态检测方法存在成本高和检测结果不准确的问题。本文采用目标检测算法并针对综采工作面的尘雾现象,提出一种融合图像去雾与Tiny-YOLOv3算法,解决传统护帮板状态检测方法存在的问题,本文主要创新性工作如下:一、为提高图像去雾算法的运行速度,设计了图像去雾
在彩色印刷行业中,套印偏差检测是彩色印刷过程中最重要的环节之一,套印精度直接影响印刷品的印刷质量。随着机械制造业的快速发展,人们对印刷产品质量的要求越来越高,对套准系统精度随之也提出了更高要求。为了改进传统中依靠人工的套印偏差检测方法,提高套印偏差检测精度,本文针对彩色套印偏差检测技术中的在线视觉检测问题进行了研究,研究内容主要有下述几个方面:对彩色套印偏差视觉检测系统的总体结构进行了设计,并对系
武侠小说是中国文学中独特的组成部分,它有别于其他的文学形式,其中很多富有“中国特色”的武侠词汇及其中所传达的侠义精神大大加深了它的翻译难度。《鹿鼎记》是金庸先生的