【摘 要】
:
针对如何快速发现微博中的热点话题,提出了一种具有更高准确率的中文微博话题检测方案。首先,优化了微博文本的特征选择,经过分析获得的这些博文特征有助于不同词性对话题表达的
【基金项目】
:
国家自然科学基金资助项目(61272367)
论文部分内容阅读
针对如何快速发现微博中的热点话题,提出了一种具有更高准确率的中文微博话题检测方案。首先,优化了微博文本的特征选择,经过分析获得的这些博文特征有助于不同词性对话题表达的重要性;其次,在此基础上,提出了通过计算博文阈值的方法,将零散主题的博文作为噪声过滤,并用来降低博文集的维度;在现有Single-Pass聚类算法的基础上,引入了主题词的概念,根据中心向量的特征权重选择主题词,最终形成一种孤立点预处理与Single-Pass相结合的微博话题检测方法。实验结果表明,相比传统的Single-Pass算法,该方法有
其他文献
目的:探讨不同抗凝方法对伴有低血小板症的多脏器功能障碍综合征(Multiple Organ Dysfunction Syndrome,MODS)患者进行连续性血液净化时的抗凝效果.方法:将12例伴有低血小板
在逻辑学与西方哲学的研究中,我们赞成将Truth译为“真”而非“真理”,它指的是其值为真的语句、命题、信念或断定.对“真”的研究,形成了各种相关理论,统称为真理论.从逻辑
对高地隙喷杆喷雾机底盘结构可靠性进行了有限元仿真和实测试验,计算了底盘结构薄弱部位的积累损伤。基于ANSYS有限元软件分析底盘结构的应力分布并确定结构薄弱部位。对喷雾
基于兰州至中川城际铁路列车开行方案及旅客出行意愿调查,通过采用相对效用值代替传统Logit模型中的效用函数值对其进行改进,并选择安全性、经济性、快速性、方便性、舒适度5
伴随着国家经济的不断发展,建筑行业也得到了很大的发展空间,然而在建筑施工中如果缺乏对建筑材料的有效管理会严重影响建筑施工的进程,从而也会限制建筑行业的发展,因此在建
针对单模型分类算法在训练样本数量较少时成功率偏低的问题,提出一种集成学习算法,并在DPA_Contest_V4数据集上进行实验。首先使用传统方法破解循环掩码,再使用SVM(support v
随着城市的发展和建设,城市的用水管理问题日益突出,尤其是城市排水工程的建设与发展问题,已经严重影响到了城市居民的正常生活与发展。因此本文将对城市排水工程存在的问题进行
目的:恶性肿瘤目前已经成为人类死亡的主要疾病,尽管针对肿瘤的靶向治疗发展迅速,但是总体治疗效果仍然不够理想。大量临床研究表明,肿瘤的免疫逃逸是造成肿瘤治疗失败的主要
素质教育下的学生,应具备多才多艺的能力,尤其是高师学生,将来要担负起为人师表的重任,因此对其能力的培养至关重要。在高师素描教学中,培养学生较强的空间思维能力,是提高教学质量
目的探讨奥氮平在肿瘤治疗中的相关性抑郁与焦虑效果。方法以计算机随机分组的原则将52例临床确诊为肿瘤且伴有相关性抑郁与焦虑的患者分成两组,每组各26例。对照组采用常规