微博主题城市时空分布特征研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:boguiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,随着信息技术的飞速发展,互联网中积累的数据越来越多,信息泛滥愈加严重。如何从大量的社交媒体数据中挖掘出用户感兴趣的主题,成为当今信息时代需要解决的重要问题。以LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)为代表的概率主题模型的出现及发展为解决热门主题的挖掘与特征分析提供了有效途径。微博数据作为重要的社交媒体数据源,对其进行主题挖掘和主题特征分析有着巨大的应用价值,本文利用适合短文本处理的主题模型BTM(Biterm Topic Model,词对主题模型)进行微博文本的主题提取,并从时间和空间层面对主题特征进行分析,主要研究内容包括:(1)对2016年9月20日至25日和10月1日至7日发布的292万余条微博数据进行预处理,得到约90万条有效数据,利用BTM进行主题建模得到48个主题并进行地理可视化,结果表明,微博主题在空间上交错分布,个体层面具有随机性。(2)空间层面,通过构建主题特征向量,利用余弦相似度计算了主题之间空间分布的差异性,发现旅游主题的地域分布特征最为明显。根据主题的空间分布特征,选取创业、美食、交通出行等六个主题作为研究对象进行空间自相关分析,并利用空间扫描统计方法对具有聚类模式的主题进行热点区域探测;时间层面,通过研究主题微博数量随时间的变化趋势,发现与娱乐、游玩等相关的主题多呈现出先增后减的变化特征,而与出行、工作等相关的主题多呈现出先减后增的变化特征;时空层面,通过构建城市特征向量,利用余弦值度量省会城市在日常和假日的相似性,结果表明在日常,各省会城市之间的相似度比较高,而在假期,省会城市之间的差异性被突出。通过构建北京、上海、苏州和丽江日常和假日的旅游主题城市交互网络,结果表明,无论日常还是假日,北京、上海均以出向旅游为主,而苏州、丽江则以入向旅游为主。(3)选取特定主题-路面塌陷,通过网络爬虫获取2013年1月1日至2018年1月1日相关的8万余条微博数据,利用BTM模型得到每条微博的主题类别并引入情感属性,对塌陷事件在时间和空间上的分布特征进行分析,结果发现,路面塌陷事件的关注度正在逐年下降,各主题下人们的主观情绪强度与事件发生数量有较强关系,而与微博数量关系较弱,且情绪较强的多为造成伤亡类的事件。通过对微博数据的分析,有助于挖掘重要的主题及其演化规律,对于事件探测、热点话题发现、舆情分析等具有重要的意义。
其他文献
地震波场数值模拟是地下勘探的重要手段。在众多数值模拟方法中,有限差分法以其方法简单、稳定等优点成为近年来最常用的方法之一。但是传统的有限差分法也存在一些不足之处,即网格单元通常是矩形,难以准确描述弯曲界面或者不规则模型边界的位置,也难以在关键区域实现局部细化。随着勘探对象的日益复杂化,无网格有限差分法以其极高的几何灵活性越来越受到人们的关注。无网格节点分布过程简单直接,无需复杂的网格剖分或者网格映
本论文在充分理解、吸收前人已有的勘探和研究成果基础上,综合地质、地震、钻井、测井、遥感、重磁以及航磁等多项资料,应用现代构造地质学、沉积学、地球物理和地球化学等手段,以断裂体系特征及其动态演化为主线,结合断裂发育特征及侧向封闭性的定量分析,综合各成藏要素研究成果,进一步认识鄂尔多斯盆地北部上古生界断裂对油气成藏条件的影响,完善了与断裂相关的油气成藏模式。首先,利用地震、电磁剖面的识别,结合重磁资料
济阳坳陷盆地内部地质构造复杂,盆地内已开采的油气资源远小于盆地内的资源总量,原因之一是盆地内发育许多断层,且断层彼此之间存在多期叠合及相互切割的现象,影响了后续有利勘探目标的选择及评价质量,对研究区块相关断裂带结构的研究在实际生产应用具有重要意义。本文围绕济阳坳陷断裂带结构测井评价研究的主题,充分调研了国内外研究现状,收集整理了研究区块地震、岩芯、录井、测井等资料,对本区块发育的断裂带结构模式进行
随着世界油气田勘探重点转向海上、薄层等油气藏,大斜度井/水平井的数量越来越多,传统电缆测井探测受限于井斜角等问题,在大斜度井/水平井中无法准确提供地层电阻率信息,而随钻电磁波测井技术有着分辨率高、对地层各向异性敏感,而且具有较大的探测深度等众多优势,因此在大斜度井/水平井中被广泛应用。尽管随钻电磁波测井在大斜度井/水平井中广泛应用,但其仍存在以下问题:(1)探测深度浅,无方位探测能力;(2)受地层
速度建模作为地震勘探的核心技术,其精度不仅关系着地下构造偏移成像的质量,还影响着地震资料解释的可靠性。地震勘探速度建模的方法主要有层析成像、偏移速度分析、叠加速度分析以及全波形反演,其中初至波走时层析成像仅利用地震波的走时信息对地下浅层速度场进行反演,对长波长的背景速度场具有较好的建模效果;全波形反演方法则利用地震波的全波场信息对地下的物性参数场进行重建,理论上能够获得最高分辨率的地下构造成像结果
随钻方位声波测井仪器在井周不均匀地层方位成像测量中至关重要。针对随钻过程中,对地层进行方位速度测量这一问题,本文基于瓦片状随钻方位换能器,综合考虑了压电-井孔调制作用,从理论及实验两个方面展开了研究。根据随钻方位换能器的性能要求,分析了结构、材料参数对其性能的影响,最终设计出了符合随钻方位测井要求的声源,指出了该随钻方位声波仪器在井周不均匀地层及跨界面地层中的综合应用。全文分为以下两个部分:第一部
火成岩潜山油气藏在全球广泛分布,但是由于其地质条件的复杂性,使得勘探难度大大加深。乍得基岩盆地为海外油田勘探重点区域,该区块岩性复杂、储层多为低孔低渗储层。本次研究主要针对潜山油气藏中测井评价的难点进行研究,对乍得基岩潜山进行系统研究认识,形成一套有效的评价方法,用来解决实际生产过程中遇到的技术难题。首先结合前人研究,总结了基岩潜山油气藏测井响应的物理基础,从岩性、物性、特征、储层评价参数、评价方
裂缝作为一种重要的油气储集空间,一直受到勘探开发人员的重视。当波在介质中传播时,不同尺度的孔缝之间会产生流体流动,这是造成波衰减的重要因素。研究波衰减和速度频散与裂缝参数之间的规律,对于勘探开发具有重要意义。为了能够准确预测裂缝参数,研究不同裂缝及其参数对于波传播特征的影响是必不可少的。对于平面型裂缝,利用周期层状White模型进行模拟。将Biot方程变换到频率域,通过频率域有限差分方法,正演模拟
随着勘探目标逐渐由构造油气藏转向岩性油气藏,人们对储层预测的精度要求越来越高。自20世纪90年代开始,越来越多的机器学习算法被引入到储层参数预测的研究中,例如神经网络算法和支持向量机算法。神经网络算法计算量大,运算效率低,支持向量机算法需要调节的参数较多。随机森林算法是多棵决策树的集合,可以很好的规避这些缺陷。相比于传统的决策树算法,随机森林算法分类效果更好、预测精度更高,而且不易过拟合,被广泛应
随着人类对油气资源的开发利用逐渐深入,常规油气资源不断被消耗,不能满足人类需求,非常规油气资源逐渐成为各国关注的焦点。相较于常规油气资源,非常规油气储层物性较差,依靠储层自身能量通常无法达到工业油气流,因此需要进行射孔、压裂等增产措施后方可投入生产。射孔作业在井壁岩石上所产生的裂缝作为压裂作业的初始条件,对压裂效果有很大影响。因此,研究射孔作业对其周围岩石的损伤规律十分有必要。本文利用有限元数值模