基于石油企业HSE大数据的隐患关联分析与可视化方法研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:suing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
石油行业HSE事件数据中包含了大量非结构化的文本数据,为了寻找隐藏在大量文本描述中事件发生的内在关联关系以及指导企业的安全管理、预防安全事件的发生,本文针对其中非结构化的文本数据,采用分词等自然语言处理技术,结合关联规则算法,构建一种针对安全隐患文本数据的挖掘方法,探究安全隐患的内因,并编制了面向石油化工领域的文本挖掘软件。(1)本文将分词技术引入石油行业HSE文本数据预处理,针对行业专业词汇分词效果不佳的问题,采用了半监督式分词方式,对高频专业词汇进行勘误并编撰整理约2500余词的自定义词典,综合现有停用词表,并加入行业所需停用词得到1926词的停用词表,获得较好的分词效果,并对分词处理后的文本运用TF-IDF算法进行关键词抽取。(2)针对常规关联规则算法与本文所处理数据间适用性较差的问题,建立了一种基于Apriori算法进行文本挖掘的模型。结合分词技术,发挥Apriori算法对布尔型数据优秀的适用性,将文本转化为由多个单词组成的事务集,从而进行挖掘,得到128条强关联规则,之后运用Network X结合matplotlib等模块将关联规则以网络图的形式展现出来。根据生成的关联规则结合网络图进行分析,得到企业在安全管理方面存在的问题,并提出建议。(3)为了便于得到数据背后的知识,提高分析效率,本文利用Python语言、Gui工具Pyqt及Qtdesigner等模块开发了文本挖掘可视化软件。该软件基于本论文所运用的文本挖掘方法并加入可视化功能,同时采用了人机交互的操作方式,让使用者在文本挖掘的过程中可以实时进行调整,直观地得到安全隐患的关联关系,具备较好的实用性。
其他文献
目的探讨高强度聚焦超声(HIFU)在弥漫性子宫平滑肌瘤病(DUL)治疗中的应用效果。方法回顾分析单独接受HIFU治疗的30名DUL患者的临床治疗,治疗三天内使用MR检查对治疗效果进行
“小方块”训练法是羽毛球训练中较为简便、灵活、实用的一种训练方法,是职业运动队常用的训练方法。采用文献法对“小方块”训练法、羽毛球训练方法以及高校羽毛球训练等相
我国卫生事业管理教育已走过35年个春秋,但仍然处在探索和改革阶段。美国卫生管理教育已走过90个年头,已经形成较为成熟的模式。多样化和层次化是美国卫生管理教育的显著特点
目的探讨超声造影定量在宫颈癌诊断中的应用价值。方法选择2016年8月至2019年1月在长安大学医院诊治的疑似宫颈癌患者570例作为研究对象,所有患者都给予超声造影定量检查和阴