基于LDA的专业个人微博事件提取

来源 :内蒙古科技大学学报 | 被引量 : 0次 | 上传用户:xibao774313066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了自动识别出博主的专业兴趣活动,提出了一种基于LDA的专业个人微博事件提取算法.该算法利用改进的TF-IDF来提取特征词以及采用LDA为语料库建模,以此来挖掘出不同主题和词之间的关系,使得权重较大的词更能反映出微博主题.进一步得到了微博在各主题下的概率分布,并结合时间相似度来计算微博之间的综合相似度,最后通过改进的K-Means聚类并与人工数据作比对.实验结果验证了该算法的有效性,同时表明了该算法可以有结构、有条理的呈现出人们感兴趣的微博事件.
其他文献
对正常价值的认定和运用是判断出口国商品是否存在倾销以及裁定倾销幅度大小的重要环节。正确理解和掌握欧盟对正常价值的认定方法,有助于我们运用正确的策略应对欧盟对我国进