【摘 要】
:
随着互联网技术的飞速发展,网络已经成为人们工作、学习和生活中不可或缺的重要组成部分。互联网媒体已经成为名副其实的“第四媒体”,大量网络的新闻的出现虽然开阔了人们的
论文部分内容阅读
随着互联网技术的飞速发展,网络已经成为人们工作、学习和生活中不可或缺的重要组成部分。互联网媒体已经成为名副其实的“第四媒体”,大量网络的新闻的出现虽然开阔了人们的视野、丰富了人们的生活,但同时也造成了信息过载问题,谣言和虚假信息的泛滥传播为舆情监控带来了新的挑战。为了帮助人们解决信息过载问题,为网络舆情监控提供技术支持,论文对热点话题检测与趋势预测技术做了细致的研究。论文的主要工作内容包括以下三个方面:第一,针对传统Single-pass的缺点,对其进行改进,提出一种基于分段时间线和Single-pass的二次聚类算法。使用时间距离因子将时间线上的文档流分段,并使用Single-pass算法完成两段式增量聚类,提升了话题检测的精度。第二,应用生物学理论中的生命周期模型对话题的热度值进行建模。由于聚类算法的差异,传统的生命周期模型与Single-pass的融合方式不适用于融合本文的算法,所以提出一种新的模型融合方式将生命周期模型融入本文的算法。采用先聚类再计算热度值的思路,在聚类过程完成后回滚时间线到当前时间距离的起始点,完成当前时间距离内的话题热度值更新。第三,提出一种新的话题趋势预测方法进行热点话题预测。在已构建的生命周期模型的基础上,使用移动平均值模型跟踪话题的热度变化趋势并结合增长率计算过程完成话题趋势预测。
其他文献
量子衍生进化算法是基于量子计算原理的一种进化算法。它以量子计算的一些概念和原理为基础,用量子位编码,量子门作为更新算子来完成进化搜索。与传统进化算法相比,量子衍生
社会保险是为劳动者提供的基本生活保障,它是现代社会保障体系中的主体和核心。社会保险管理信息系统是为适应新形势下社会保险制度的改革和现代化管理信息手段的要求而提出
图像增强是对图像质量的一般意义的改善,其目的是通过一系列技术去改善图像的视觉效果,或将图像转换成一种更适合于人眼观察和机器自动分析的形式。但图像增强往往带有针对性
车牌识别系统(LPR)是以汽车牌照为特定研究对象的专用计算机视觉系统,是计算机视觉和模式识别技术在智能交通领域里应用的重要研究课题之一。在系统的各个环节中,车牌图像二
Web服务发现技术能够在庞大的信息服务群中发现请求者所请求的服务,然而传统的服务发现技术是在语法描述的基础上,通过关键词匹配来实现,因此除了查全率和查准率不高等缺点外
随着科学技术的日新月异和网络产业的高速发展,计算机界对资源共享的需求越来越大。通信,航天,生物等各种高科技领域都需要超大规模的计算和数据分析能力予以支持。局部的计
"REST"(Representational State Transfer,表示性状态转移)一词是2000年由Roy Thomas Fielding在其博士论文中提出的。近年来,国内外都开始了基于REST的研究。但是由于REST只
近年来,应用P2P模式解决流媒体服务系统的瓶颈问题受到越来越多的重视。如何能够在充分利用P2P网络中众多节点资源、处理能力的前提下,确保流媒体服务质量、提高播放的性能,
彩铃业务是个性化多彩回铃音业务(Color Ring Back Tone,CRBT)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。自2003年中
随着教育信息化的不断发展,海量的网络教育资源既为教育带来了强大的服务功能,也为资源的建设与管理带来了新的挑战。如何将分散、无序的资源整合起来并吸引各类教育资源使用