跨媒体热点追踪系统的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lrdg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,单一形式的媒体传播不再满足受众的需求,跨媒体信息传播这种新兴的传播形式随之应运而生,那么,跨媒体热点信息如何获取,该类信息在传播过程中存在哪些特点,起到关键媒介作用的用户是谁,这些都是网络舆情领域中有待研究拓展的问题。本文就热点信息的跨媒体传播展开研究,目的是开发出一个基于新闻和微博两类媒体的跨媒体热点追踪系统,这个系统能够识别新闻中的热点事件,并能追踪该热点事件从新闻媒体到微博媒体的传播过程,进而获取大量的跨媒体热点传播信息,并从定量的角度分析热点事件的跨媒体传播特点,进一步挖掘在传播过程中起到关键作用的媒介用户。本课题主要进行了三点研究:第一点是跨媒体信息采集,为了获取具有热点性的较为全面的新闻和微博数据,提出一种有效的数据采集方案,并针对热点事件在微博媒体中的传播情况进行持续追踪,对于传播过程中关键媒介用户的动态进行持续监测;第二点是跨媒体信息关联,对于已获取的新闻数据和微博数据,设计出事件关联、精确关联的二次关联方法,实现了新闻和微博两类不同媒体的热点信息关联;第三点是跨媒体信息分析,针对新闻事件在微博媒体中的传播情况,构建了融合评论、转发、点赞多重网络的事件传播网,进而完成基于新闻事件的跨媒体热点信息传播模型的构建,通过分析该模型,从定量的角度证明该传播形式符合二级传播理论,同时为了发掘出传播过程中的关键媒介用户,设计并实现综合考虑信息传播、个人属性及事件相关性三类因素的Page Rank改进算法。通过实验验证了以上三点研究的实用性,并进行了跨媒体热点追踪系统的开发。本系统采用生产者-消费者、观察者、单例等设计模型,利用多线程、数据库缓冲池、网络爬虫等技术设计并实现跨媒体热点信息采集、关联和分析等几大功能。经过测试,系统效果符合预期。
其他文献
说话人识别属于生物认证技术的一种,是一种根据语音波形中反映说话人生理和行为特征的语音参数来识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便
随着英特网的发展,人们越来越多的面临怎样有效地查找相关外语文件的问题。在互联网发展初期,网络内容以英文为主,上网用户也多来自美、英等发达国家,但此后,来自其他国家的
数字电视是目前最具发展前景的产业之一,我国也推出自己了的地面数字电视广播标准—DMB-TH。在这种形势下,各种针对DMB-TH的数字电视产品都被开发出来,便携式移动电视接收机
嵌入式软件的特殊性使得其开发过程比传统的通用计算机软件要复杂得多,而调试作为嵌入式系统开发中的关键环节,扮演着十分重要的角色。目前,国内在嵌入式调试技术方面所做的
数据挖掘是当前国际学术界一项前沿的研究课题,它融合了数据库、人工智能、机器学习、统计学、智能计算、认知科学等多个领域的知识,是数据库研究中很有应用价值的一个新方向
2012年12月13日,我国的月球探测器嫦娥二号在距地球约700万公里的深空,以10.73km/s的速度770m的最近距离成功飞掠4179小行星Toutatis,获得了最高分辨率优于3m的系列可见光图
碎片复原技术是计算机视觉、图像分析和模式识别等领域中的重要研究课题,它开辟了模式识别新的应用领域,具有广泛的实用价值,一直为国内外学者所关注。本文在研究传统角点提
字符串相似性搜索在众多的领域具有广泛的应用,例如:数据清洗、数据集成、拼写检查、抄袭检测、生物序列分析等。到目前为止,有很多度量标准用来衡量字符串之间的相似程度,然
中间件是一种独立的系统软件或服务程序,能够屏蔽网络硬件平台的差异性和操作系统与网络协议的异构性,使得分布式应用软件得以在不同的技术之间共享资源。当前,面向对象分布
随着用户越来越倾向于输入自然语言作为查询,问句理解成为了问答系统等领域中的研究重点之一。然而现有问答系统技术对复合事实型问句的处理效果并不完美,不能很好地理解用户