一种基于关键词的微博话题聚类算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:gaolch003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于微博跟现实生活有着密不可分的联系,微博的话题聚类可以发掘人们所关注的话题,有利于引导公众舆情。由于传统的文本聚类方法主要适用于长文本,LDA(Latent Dirichlet Allocation)话题模型是一个比较成熟也比较全面的话题聚类方法,实验中利用LDA模型来发掘当前公众讨论的热点话题,提出一种文本关联词算法。利用LDA得到的关键词进行聚类分析,也可以对LDA话题聚类后的结果进行优化调整,得到的结果与标注数据集进行对比分析,实验结果证明该算法能够提高聚类的正确率、召回率和F值。
其他文献
一幅油画复制品主要具有装饰美化、推广传播以及作为学习研究范本的作用,有着很大的市场需求及价值。特别是世界名画的高仿真复制,由于名画原稿一般消费者及美术学习者很难获
"一带一路"倡议自提出以来,在全球引起了广泛关注,对国外媒体的报道进行分析和解读,有助于我们了解"一带一路"倡议在国际上的影响,同时也有利于我们制定更具针对性的对外传播
电力通信网络以通信装置为硬件基础,通信装置运行的稳定性和可靠性对整个电力系统的正常运行起到非常关键的作用。所以,对于电力系统通信故障实行精确的定位且对故障进行维修
自媒体是信息高度发达和自由化的产物,由于现在智能手机的普及率非常高,因此自媒体的应用也逐渐广泛,虽然其拓宽了大学生获得信息的渠道,但是自媒体平台中充斥着的大量负面信
数学课堂教学是实施素质教育的主渠道。教师必须认真领会新课标的要求,掌握新方法,真正让课堂成为师生探讨、研究问题的场所,培养学生能力,提升课堂教学效果。
2020年元月以来,由“新冠”开启,世界迈入了健康与疾病交叉并行的疫情时期。“新冠”热词伴随病毒疫情,通过大规模和突发性撼动并拆分着人类社会既有的公共空间与相互聚集。