基于特征驱动的微博话题检测方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zongduzhicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对微博数据稀疏、内容关系难以计算的特点,提出了一种基于特征驱动的微博话题检测方法。提取有意义串作为微博动态特征,根据微博的结构关系计算特征的作者影响力和文档影响力,与内容统计特性共同构成特征的属性组,采用逻辑回归对特征建模,基于属性组对特征二元分类得到话题关键特征,将关键特征之间的互信息作为距离度量,改进最近邻聚类方法对关键特征聚类产生话题。微博数据实验表明,该方法有效提高了微博话题检测的准确率和召回率。
其他文献
农村基层党组织功能发挥的优化路径农村基层党组织具有领导功能、政治引领功能和服务群众功能等主要功能。实现并进一步优化这些功能,需要符合农村社会的自组织特点。具体说
德国联邦议院选举初步计票结果9月25日凌晨出炉,总理默克尔领导的联盟党获得33.0%的选票,保持联邦议院第一大党地位。这意味着默充尔即将迎来她的第四个德陶总理任期。