微博网络热点话题发现技术研究

来源 :北京交通大学 | 被引量 : 8次 | 上传用户:hldu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博已经成为当今社会新一代的重要媒体,几乎现实社会中的事件都会在微博中形成讨论,并进一步酝酿发酵,进而影响到现实中的社会事件。因此对微博网络中话题的产生发展及影响力研究,是当前业界关注的问题之一,具有较强的社会意义和现实意义。本论文的主要工作如下:1、研究了微博文本的特点,并针对其特殊性分析了现有文本处理策略对微博文本的适用性,在现有文本表示策略的基础上,结合微博网络的特点,提出了一种适用于微博短文本的文本表示策略,其基本思想是将TFIDF策略与近义词库应用相结合,对传统的特征空间进行调整,合并具有相关性的特征项,以修正传统特征空间中正交假设带来的文本相似性度量的偏差,并利用微博评论扩充微博文本,从而能够更准确的计算文本间的相似度。2、在分析现有聚类算法的基础上,给出了传统文本聚类算法的优缺点,并在分析微博网络中话题的发现对聚类算法的要求的基础上,提出了增量式聚类算法Ant-tree的改进算法——RD-Ant-tree算法。该算法利用Ant-tree算法在效率上的先天优势,针对Ant-tree算法对数据输入顺序敏感的问题,通过动态调整结果树,降低了输入顺序对算法结果的影响,以达到实现更稳定的聚类效果的目标。3、通过对微博网络中突发事件传播模型的研究和二次传播理论在微博中的应用,建立了微博话题热度与潜在影响力的评估模型,以期对微博话题的热度进行更准确的评估并通过评估话题的潜在影响力更早的发现热点话题。4、在以上理论研究的基础上,本论文还对微博网络热点话题发现系统进行了设计与实现,并通过实验验证了该系统的实用性。
其他文献
随着云计算网络的快速发展,作为云计算基础框架的数据中心网络吸引了来自学术界和工业界的广泛关注,并得到了高速发展。诸如数据收集、视频内容托管交互、社交网络等网络应用
目前,当使用基于大规模语料库的合成方法时,通常采用高质量构建的合成语音库,以此来保证合成语音达到非常理想的状态。所以现有的语音库为了进一步提高合成语音的效果,其创建的要
在日常生活中,我们经常会产生内疚、气愤、焦虑、伤心、恐惧、不满等不良情绪,心理学家将这些不良情绪统称为负性情绪。在负性情绪中,恐惧是最易出现的。当一个人情绪调节失
毫米波被动成像的原理即利用场景和目标自身的毫米波辐射能量分布差异实现成像,其不受沙尘、烟雾、黑夜等恶劣条件的影响。毫米波被动成像技术能探知被伪装的物体、工事和被厚
图像边缘包含图像最重要的特征,边缘提取是模式识别,人脸识别,图像分割等后续复杂图像处理的基础。随着物联网,大数据的普及,图像复杂度也随之增加,已有灰度图像边缘提取算法
弹道导弹是现代战争中极具威力的进攻性武器,导弹战将成为战争初期或关键时刻的主要作战方式。雷达作为导弹防御系统中的核心探测器,其跟踪、识别性能的优劣对整个导弹防御系
二次优化问题在科学研究和工程应用中扮演着重要的角色,比如在还原分析、信号与图像处理、制造业、最优控制以及系统识别等方面都有重要应用。然而,传统的优化算法在实际应用
人工神经网络由大量处理单元互联组成的非线性、自适应信息处理系统,在模式识别、图像处理、非线性优化等方面得到了大量的应用。为了描述系统状态的瞬时变化现象,近几年,人
脉冲多普勒探测系统发射受脉冲调制的高频振荡信号,来探测目标(或其环境)信息,对获取的信息(其中混杂各种干扰信号和无用的信息)进行实时信号处理,提取主要的和有用的信息,如
本文主要研究了认知无线局域网环境中的网络资源管理架构和无线资源管理策略选择机制。首先介绍了认知无线网络的相关概念、发展现状以及IEEE1900.4标准的资源管理架构和基于