基于LDA主题模型的微博检索研究与实现

来源 :信息技术与信息化 | 被引量 : 0次 | 上传用户:wuhu001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博用户的增长,微博文本量也呈现出爆发式的增长趋势。面对如此海量的文本数据,如何有效地检索有用的信息对微博用户是十分重要的。本文采用基于TF-IDF计算,先找到关于词频相似的微博文章;然后利用LDA主题模型的方法,筛选出主题内容相似的微博文章。实验结果证明,采用该综合检索方法,用户能够检索出更加符合用户实际需求微博文章。
其他文献
媒体是一个拥有自己生态系统的有机'生命体'。在媒体格局不断变化的今天,借用生态学'群落生境'一词隐喻媒体空间,科技报刊融合发展其实正是探寻'媒体群
通过对我国科技情报行业发展历程的回顾与现状分析,学习借鉴国内外智库发展的成功经验,提出我国新时期传统科技情报机构转型发展的思路。在实施创新驱动加快智库建设的背景下
目的了解河池市近年无偿献血者抗.HIV感染状况,为制定招募无偿献血者的策略提供科学依据。方法用双抗原夹心酶联免疫法对本市无偿献血者血标本进行抗。HIV检测,并按不同年份进行
随着高校网络信息化建设的不断发展,各高校的无线漫游技术日趋成熟,国内甚至国际高校间都存在着相互之间无线漫游认证接入的需求.本文分析了eduroam无线漫游认证工作原理,并