突发公共卫生事件下网民多维分类研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liangmingming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的以突发公共卫生事件为分类场景,分析影响突发公共卫生事件中网民分类的多种因素,从多个方面综合考虑网民自身特点及其与事件的关系,综合利用网民多种类型的特征,从多个维度分析网民特点,构建一种此场景下的多维细粒度的网民分类模型。方法通过总结国内外网民分类的相关研究,结合网民自身的特点如网民自身的人格特点、兴趣偏好、活跃度等,和具体的分类场景,综合网民与事件的关系、网民在事件中的作用,根据相关理论,确定了网民分类的四个维度,网络人格标签、网民影响力、事件关联度和主题关注度。通过Word2vec扩充简体中文版LIWC词典构建人格词典,基于网民发布的博文文本,基于人格词典计算网络人格得分,分析网络人格标签;通过层次分析法确定传播力、活跃度、可信度三个特征组及具体特征指标的权重,构造影响力公式,计算网民影响力;利用Python工具编写程序对网民与事件间的关联度特征进行匹配,计算得到事件关联度;通过TF-IDF和LDA主题模型提取网民博文文本和事件相关文本的特征词,利用向量相似度计算,分析网民对事件的主题关注度。进而依据四个维度及各维度下的方法进行综合分析构建网民分类模型——ICN模型,并且选取一目标事件对网民多维分类的结果进行呈现。结果通过构建的网民分类模型,将网民划分为八个类别。通过对四个维度进行综合分析,事件关联度和主题关注度共同决定了网民与事件的相关性,从这两个维度共同分析网民与事件的相关性,从多个维度将网民分为高影响高相关高神经质(Influence,Correlation,Neuroticism-High,简称ICN-H)网民,高影响高相关低神经质(IC-H)网民,高影响低相关高神经质(IN-H)网民,低影响高相关高神经质(CN-H)网民,高影响低相关低神经质(I-H)网民,低影响高相关低神经质(C-H)网民,低影响低相关高神经质(N-H)网民,低影响低相关低神经质(Influence,Correlation,Neuroticism-Low,ICN-L)网民。通过从四个维度构建的网民分类模型及具体分析方法,选择武汉封城事件对网民分类结果进行呈现,根据突发公共卫生事件的特点,选择事件关联度下网民所在地这一特征指标,进行事件关联度的匹配计算,武汉封城事件下得到122名关联度较高的网民。利用TF-IDF关键词提取和LDA主题模型进行微博网民兴趣偏好挖掘和事件的主题特征提取,通过计算网民的关键特征词与突发公共卫生事件主题词的语义相似度,武汉封城事件下得到496名兴趣主题关注度较高的网民。通过传播力、活跃度、可信度三个特征组及各组的具体特征指标,计算网民的影响力,武汉封城事件下得到446名影响力较高的网民。通过对简体中文版LIWC词典进行扩充得到人格词典,利用人格词典各类别词汇与人格特质的皮尔森系数计算网络人格得分,武汉封城事件下得到342名神经质性较高的网民。结论(1)综合分析网民的内外部特点,结合网民自身的特点、网民与其他网民之间的关系、网民与事件之间的关系,从这些角度出发,结合大五人格理论、价值累加理论、解释水平理论、参照群体理论、两级传播理论和相关研究,将兴趣挖掘、人格特质引入分类思想,确定了网民分类的四个分类维度—网络人格标签、事件关联度、主题关注度和网民影响力,从四个维度将网民划分为八个类别,构建了网民多维分类模型——ICN模型。(2)在突发公共卫生事件场景下,构建多维的网民分类模型,从各个维度综合地对网民进行分析,能够对网民进行多维细粒度的分类。四个维度能够分别从网民自身是否更容易产生负面情感、网民和事件的相关程度、网民对事件的兴趣关注程度、以及网民在网络中的影响力度对网民进行分析,使划分的每类网民群体有更细致的特点描述。
其他文献
目的:本实验以宫颈癌Hela细胞为研究对象,分析天花粉蛋白(TCS)对Hela细胞中miR-1290表达?继而对Hela细胞EMT的影响。方法:(1)实时定量PCR技术验证TCS对miR-1290表达的影响是否与芯片结果一致;(2)Transwell技术用于检测miR-1290表达对宫颈癌Hela细胞迁移和侵袭能力的影响;(3)Western blot检测miR-1290对上皮间质转化(EMT)相
近年来,光催化技术蓬勃发展,有望解决当前严峻的能源危机和环境污染问题。类石墨相氮化碳(g-C3N4)因其较好的可见光响应、成本低、易制备以及稳定性好等优点,在可见光催化领域引起了研究者的广泛关注。然而,单独的g-C3N4仍存在光生电荷难分离以及光量子利用率差等缺点,这极大抑制了其光催化活性。针对此问题,本论文以g-C3N4为基础,通过对其进行表面改性并且负载适当的助催化剂,制备了三种不同的g-C3
随着信息技术的高速发展,各行各业对带宽的需求越来越高。因为香农极限定理限制着基于单模光纤的光通信网络容量上限,迫切需求革命性的新技术解决当前网络容量挑战。一种以少模光纤为传播媒介的模分复用技术应运而生,该技术采用相互正交的空间模式作为互不影响的传播通道,能够提高光通信系统容量。然而,少模光纤中独有的损伤特性如模式相关损耗、模式耦合、差分模式群时延会影响模分复用技术的传输能力,降低模分复用系统的传输
新能源电动汽车的发展对动力电池的能量密度有了更高的要求,目前商用的锂离子电池受其正极材料的制约,能量密度已达到极限值。开发更高能量密度的电池体系是未来动力电池的发展方向。锂硫电池作为新一代二次电池拥有超高的理论能量密度。为解决其穿梭效应引起的容量快速衰减的问题,在隔膜上修饰一层功能性中间层材料来阻挡多硫化物向负极扩散是简单而行之有效的方法。本文从修饰隔膜的中间层材料角度出发,研究了隔膜中间层材料及
电能是目前人们生产生活中使用最广泛的能源之一。随着社会发展和科技水平的进步,配电规模的逐步增大,降低线损消耗,实现绿色低碳的配网发展是供电企业迫切需求。线损是衡量供电企业经营管理水平的指标之一,也是制定科学合理的降损措施的重要依据。但是,目前在供电企业常用的三种线损率计算方法依然存在着不能全面、系统地反映线损的情况,比如由于受到电网运营需要及电能计量自动化水平的限制,电力企业月度供电量和售电量的统
目的:基于问题解决情境理论,探讨个体特性、健康风险认知水平对问题解决相关变量以及对信息搜寻行为的影响及作用路径,了解健康风险信息搜寻用户的心理认知特性以及信息搜寻过程中的心理认知因素间的相互作用机制,阐释信息搜寻行为的内在机理,为面向情境大数据建模及其用户行为预测提供理论依据。方法:在对相关文献总结梳理基础上,探讨信息搜寻过程中的心理认知因素,构建健康风险信息搜寻行为的认知因素理论关系模型,提出相
目的:了解ICU患者医院感染多重耐药细菌种类分布、来源分布及耐药情况,分析其产生的相关危险因素,以便加强多重耐药菌监控和抗菌药物应用管理,为临床合理用药提供依据,并提出有效的预防措施。方法:(1)回顾性收集2014年6月-2017年6月期间我院ICU病房所有送检病原菌结果符合医院感染多重耐药的病原菌检验资料,统计并分析所有医院感染多重耐药病原菌种类分布构成、病原菌标本来源分布及病原菌耐药情况。(2
随着5G的正式商用,“万物互联”的时代即将到来,为了应对未来网络持续爆炸增长的移动终端数量,以及指数级倍增的数据流量,密集化部署接入节点的超密集异构蜂窝网络(Ultra-dense networks,UDN)是未来移动通信网络的关键技术之一。超密集异构蜂窝网络通常由大量的低功耗、低成本的微小基站组成,其部署密度远远超过现阶段的移动通信网络,具有优化频谱效率、提升小区用户覆盖率和布设自由度高等优点。
目的:社交网络的发展为抑郁倾向人群的情感倾诉提供了新的途径。本文以新浪微博为社交媒体代表,通过构建微博抑郁倾向用户的画像模型,挖掘当前社交网络中该人群的语言内容和情绪特点,可视化展示该人群在社交媒体中的典型特征,为利用互联网技术实现抑郁症患者的早期识别提供参考。材料与方法:以用户画像视角入手,从个体维度、时间维度、内容维度和情感维度四个方面构建微博抑郁倾向人群的CUTE模型。利用文献调研法梳理研究
当今社会,人们的生活与工作节奏加快,随之带来的压力越来越大,导致心律失常患者的比例逐年提升。心律失常是一种常见的心血管疾病且不易被发现,心律失常的诊断需要具备心电知识的专业医生观察48小时的动态心电图来确认。然而,人工诊断心律失常过于耗时耗力,且要求医生具备丰富的心电病理知识和心电疾病诊断经验。因此,设计出一种基于心电图的心律失常的分类算法辅助医生诊断是十分必要的。目前,众多研究者提出了大量基于心