基于改进LDA模型的微博用户兴趣挖掘系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wdwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化水平的不断提升,新浪微博活跃用户持续稳定增长,同时产生了海量的微博数据。微博数据反映了用户的兴趣偏好,对用户发布的微博文本进行分析,可以帮助他们发现感兴趣的话题;同时平台也可以基于用户兴趣进行个性化推荐,实现盈利。综上所述,用户兴趣挖掘对提升用户使用体验和促进平台健康发展具有重要意义。微博文档通常具有较长的时间跨度,用户兴趣也会随着时间的推移而不断改变,微博文本简短且包含了较多的噪音数据,这些都给用户兴趣挖掘带来了挑战。针对以上问题,本文提出了一种有监督的动态主题模型DS-LDA(Dynamic Supervised LDA),该模型基于较细的时间粒度,结合了文档的时间和标签信息,考虑了主题-词语分布在不同时间阶段内的差异,实现了有监督的动态主题建模;本文将该模型和其他主题模型相对比,实验表明取得了较好的效果。此外,针对新浪微博网页端的特点,本文还实现了实用的用户兴趣挖掘系统:数据爬取模块负责抓取用户微博数据,数据处理模块进行去停用词、去噪处理,兴趣挖掘模块基于DS-LDA模型对用户兴趣进行预测,结果可视化模块对兴趣挖掘结果进行展示。
其他文献
互联网原始设计主要用于可信环境,侧重于网络的互连,而缺少对网络安全的考虑。伴随着互联网逐渐走向商用,其面临着严重的安全威胁,而“外挂式”安全机制虽能解决特定安全问题,但却使得网络协议越发臃肿,由此产生了内生安全网络研究。其中,网络流量安全是内生安全的一个重要方向,如何在高效、精确、低成本又兼顾用户隐私的情况下,识别出网络流中的恶意流量显得尤其关键。本文针对内生安全需求,分析了现阶段网络中恶意流量识
随着移动智能的发展,人们对精确的室内定位技术和完善的基于位置服务的需求日渐迫切。以精准室内定位技术为基础的位置服务能够在商业、便民服务、安全等多领域广泛应用,是智慧城市建设的重要发展方向。常见的基于Wi-Fi接收信号强度的室内定位方式存在着信号波动大、采样和维护成本高、定位精度差等问题。近年发布的IEEE 802.11mc标准支持Wi-Fi精确时间测量(Wi-Fi Fine Time Measur
中医是我国传统医学的瑰宝,其在漫长的发展与演变过程中,逐步形成了一套对疾病进行审证求机、辨证施治的学科理论体系。在新冠疫情肆虐全球的时代背景下,中医以其独到的方法体系与施治特点在治疗新型肺炎疾病和预防疫情传播上起到了至关重要的作用,得到了国内外医学专家广泛的关注与高度的赞扬。在中医长期施治于临床的过程中,对不同疾病相匹配的类症鉴别、病因病机、临床特点有了较为系统的认识,形成了有待于挖掘与应用的海量
随着智慧城市的加速建设,公共交通的视频监控对于提高公共安全具有举足轻重的作用。车辆后拍图像包含车型、车牌等特征信息,基于后拍图像的超分辨率重建技术旨在恢复低分辨率车辆后拍的细节信息。超分辨率任务中,低-高分辨率数据对的难以获得始终为研究瓶颈之一,目前主流的超分辨率方法集中在重建采用人工固定的退化核进行退化的图像,对自然低分辨率图像的作用较为有限。因此针对真实监控场景的车辆后拍图像进行超分辨率重建是
可见光通信(Visible Light Communications,VLC)是以光作为信息传输载体、将信号加载到可见光上的一种新型无线通信方式,其拥有更大的通信带宽和更高的通信速率,已经成为当前通信领域中的研究热点。同时,由于可见光通信的传输距离远、保密性好等优点,其在海洋水下通信中也具有非常大的应用价值。信号解调在VLC系统中起着至关重要的作用,现有关于可见光信号解调的方法基本都是沿用无线通信
随着我国物流业的快速发展,快递业务量呈爆炸式增长,人工配送成本越来越高,社会对配送效率的要求也越来越高,以人工配送为主的传统物流已经无法满足社会需求。近年来,无人驾驶技术的兴起为物流配送提供了一个可行的解决方案,路径规划是物流配送的主要问题之一,研究无人车路径规划技术辅助无人车辆进行智能路线规划,对提升物流配送效率具有重要的意义。论文分别对无人车物流配送的全局路径规划和局部路径规划进行了研究,主要