在线社交网络信息传播建模和流行度预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shangwenqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,在线社交网络作为新的传播媒介其应用规模与日俱增。人们在社交网络中即是信息的消费者,也是的创造者和传播者,使得信息呈现爆炸式增长。在此过程中,社交网络逐渐取代了传统媒体的主导地位,影响人们的思想,冲击着人们的人生观、价值观和世界观。同时信息呈现核裂变式的扩散方式,加速了社会热点的形成,有害的舆情又对国家安全和社会稳定带了负面影响。因此针对在线社交网络的信息传播研究具有重要的应用价值和实际意义。目前,针对社交网络的信息传播研究已有大量工作。然而传播演化机理研究涉及网络科学、社会学和心理学等多个学科领域,尚缺乏交叉学科的研究成果。本文围绕着信息传播的“网络结构”,“用户群体”和“信息内容”三要素,借鉴社会学理论,研究了网络结构对信息传播的影响。针对信息内容流行度分布的无标度特性,着重研究了流行度预测问题,在Facebook和腾讯新闻数据集上展开深入研究。本文的主要贡献和创新点总结如下:(1)在传播建模方面,针对传统工作未考虑信息多次冗余接触对个体行为影响的问题,引入社会学中的主流疲劳理论,提出了一种新的信息传播模型。通过在微观层面将社交网络中的用户划分为四种演化状态,采用交互式马尔科夫链方法从信息传播的时间、空间特征在微观层面对个体的状态转移进行概率表示,并推导出其信息传播的动力学方程组。通过人工网络与真实社交网络的蒙特卡罗模拟表明,网络结构会对信息传播产生影响,而同一信息对网络个体的多次冗余接触可能带来负面影响,从而降低传播效果。(2)在流行度预测方面,针对建模求解过程中的特征选择与预测准确率难题,提出了一种针对社交网络转发流行度的预测模型。通过分析Facebook主页历史发布消息的转发规律,发现如果一个消息在传播早期能吸引较多的弱连接用户参与转发,在未来更易取得较大的流行度。基于以上发现提取了连接强度特征,并融合消息传播早期的流行度建立了多元线性回归方程。在Facebook真实数据集(含154万次转发)上与其它具有代表性的基准模型进行的比较实验表明,本文提出模型对最终流行度预测性能优于现有方法。(3)在预测模型的适用性方面,针对社交网络中复杂的多信息并发传播环境,提出了一种基于竞争矩阵的流行度预测模型。目前预测模型大多基于信息独立传播这一假设为前提建立,然而实际情况是公众关注度经常会因为热点事件的发生而产生迁移,从而导致预测失准。本文通过研究腾讯新闻的评论数据集,利用熵方法阐释了信息竞争的存在以及用户关注度的有限性。针对信息内容复杂多变的表示难题,通过神经网络的方法对海量新闻文本、用户评论进行文本的向量表示与分类,构造竞争矩阵并使用梯度下降方法进行求解。对比实验表明本文提出的预测模型适用于多信息竞争环境,具有更好的预测性能。(4)设计实现了一套信息传播分析与预测系统,应用于互联网舆情分析、突发事件传播趋势预测等实际需求。系统主要由信息采集、数据存储、预测分析以及前端展示等四层构成,可实现针对Facebook、腾讯新闻、新浪微博等典型社交平台的数据获取、分析和预测,并取得较好的实用效果。
其他文献
代理成本理论认为,公司对资本结构的决策对于提高组织效率至关重要,因为债务协议中的限制性契约可以监控管理层的支出习惯,从而促使公司进行有效的管理实践。然而,尽管债务可能会阻止公司做出不良投资,但研究表明,债务也可能会阻止公司做出优质的投资。因此理论表明,债务融资可能对公司绩效产生非线性影响。本文的第一部分分析了债务融资是如何决定组织效率的,并利用世界的主要经济体,即中国、日本和美国的数据,论证了公司
随着高超声速飞行器的快速发展,传统的防隔热材料已无法满足飞行器对于热防护材料防隔热一体化的技术要求,新一代防隔热一体化复合材料能够满足未来飞行器在高温、长时、大热流、高焓值、高动压使役环境中的需求。本课题针对高超声速飞行器的高温区对于新型防隔热一体化复合材料的迫切需求,提升复合材料的热稳定性,获取复合材料的关键性能,优化抗氧化涂层的设计和制备工艺,开展涂层抗氧化烧蚀性能研究,阐明涂层烧蚀机理和失效
在实际生活中,语音信号总是不可避免的受到背景噪声的干扰,进而影响人与人、人与机器之间的正常交流。因此,开展从背景噪声中分离出纯净语音的语音增强技术相关研究就显得尤为重要。经过数十年的发展,单通道和多通道语音增强技术均取得了重大进展。其中,单通道语音增强技术由于具有部署简单、对设备要求低等优点,因而受到企业和研究者们的广泛关注。单通道语音增强作为一个欠定问题,通常需要引入额外的先验信息才能使其求解成
粘连是一种最常见的术后并发症,一般发生在受损组织愈合的过程中。在特殊情况下,术后粘连还会伴有炎症、疼痛甚至运动障碍等症状,严重影响了患者的日常生活。目前,高分子防粘连材料是临床上预防术后粘连最有效的屏障材料,可以将病变组织进行物理分离。因此,其逐渐成为研究的热点。该类材料不仅在临床应用上易于处理,生物相容性好,可生物降解,更能为目标部位提供防止组织粘连的可靠屏障。近年来,几乎没有高分子屏障材料可以
21世纪以来,随着信息技术的更新与发展,电子商务平台得以迅速崛起。以天猫、京东、亚马逊为首的大型电子商务平台为其平台上的产品和服务设置了评论模块,这让消费者能够分享他们真实的购买体验或者从在线评论中获取产品或服务相关的内容。但是,在线评论体量巨大,人们很难在短时间内浏览所有评论并提取重要信息来选出心仪的产品。因此,基于在线评论的商品排序的研究已成为管理决策领域的热点。然而,现有的基于在线评论的商品
全球11亿吸烟者中,约有80%生活在发展中国家。世界约有三分之一的烟草生产和消费发生在中国,据估计,至2030年中国约有200万人因烟草死亡。同样,在巴基斯坦,由于戒烟政策不力和戒烟措施失效,2018年全国仅19%的人口就消费了超过700亿支卷烟,控烟困难重重。因此,发展中国家需要更有效的控烟措施,并防止戒烟者复吸。对此,世界卫生组织颁布MPOWER综合战略和《烟草控制框架公约》为各国控烟提供帮助
地铁换乘站基坑在施工过程中要严格控制其变形及对周边环境产生的影响。尽管流固耦合与非流固耦合分析结果有一定差异,但现有地铁换乘站基坑开挖变形计算中较少考虑流固耦合作用。本文针对济南长途汽车站地铁换乘站进行基坑变形分析,建立了考虑流固耦合的三维有限元模型,根据模拟结果,确定出地连墙最大侧向位移及地面沉降最大值发生的位置,并对地铁换乘站基坑变形规律进行了总结和分析。本文研究成果可以为类似地下工程基坑分析
环境污染和资源短缺的问题引发了学术界和管理者对于环境保护和可持续发展的思考。消费者对于能源和材料的过度消耗是导致环境恶化的原因之一,因此倡导绿色消费,减少因消费而引发的环境问题具有重要的现实意义。绿色产品信息是促进消费者购买绿色产品最直接的工具。企业和市场人员在利用包含数值的信息与消费者沟通绿色产品的能源效率或者环境影响时,可以采用了两种不同的方式,即基于较大测量尺度或者基于较小测量尺度。对于哪种
学位
市场导向的不道德行为,即不道德的销售和营销行为,一直是学者们关注的领域。迄今为止,学者们已经研究了许多导致此类行为的原因。由于市场导向的不道德行为发生在市场情境中,因此有必要验证与市场有关的因素在促进这种不道德行为的作用。这种与市场相关的要素在既有研究中被忽视了。在与市场有关的因素中,市场竞争是员工参与针对市场不道德行为的潜在决定性因素。由于新竞争对手的出现、竞争优势的减少、消费者需求的频繁变化等