基于语义串特征提取及融合评价的维吾尔文文本聚类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:daifei147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究一种改进的n元递增算法来抽取文本中表达关键信息的语义串,然后用多特征融合的评价方法为每一个文本选取最重要的语义串,并用这些语义串作为特征表示文本。通过K_means聚类分析的实验结果表明,以语义串作为特征可以构造比单词特征集更紧凑的文本模型,不仅可以大大降低特征空间的维度,对于提高聚类算法性能也是非常有效的。
其他文献
传统无监督的主题建模方法利用相互独立的主题变量抽象描述文本语义,忽略了各主题内部隐含的结构和联系,粗粒化的文本主题分析加剧了"强制主题"问题对文本建模的影响。该文通
随着社会的发展和技术的进步,传统的线性视频技术已无法满足实际需要,而近年来计算机技术的突飞猛进,使非线性技术得以快速发展.在微课视角下开展《非线性编辑》课程的教学实
规划细胞死亡(apoptosis ) 是对病毒感染的关键宿主回答。能调制主人 apoptotic 回答的病毒是可能的为传播获得重要机会。这里,我们考察示威的最近的研究那无脊椎的虹彩的病毒
以便测定在 vitro 的牛的免疫不全病毒(BIV ) 感染,一根 BIV 指示物房间线(BIVL ) 被 transfecting 婴儿仓鼠肾房间与包含一个 BIV 长终端重复倡导者驾驶的萤火虫酶基因的记者
2018年8月2日-4日,第七届未来数据论坛暨第五届大搜索论坛在黑龙江省哈尔滨市举行。本次大会由中国工程院、FFD and BigSearch Steering Committee主办,哈尔滨工业大学、国防
VP1,猪的衣壳蛋白质小囊的疾病病毒,从 SVDV HK/70 紧张被克隆并且插入了到 retroviral 向量 pBABE puro,并且由一个 retroviral 表示系统在 PK15 表示了房间。VP1 蛋白质的能力
Baculoviruses 生产二病毒的显型,发芽病毒(BV ) ;导出吸藏的病毒(ODV ) 。ODV 在他们开始主要感染的中肠被免除吸藏身体。由于一个离体系统的缺乏, ODV 感染的分子的机制仍然是
人们刚刚适应数字化生存不过几年时间,科学界又传来利用数字可以“传真”生命的技术,即把一台数字序列收集器送入其他星球,可获取任何生命形态或近生命形态的遗传代码,然后将遗传
8月22日,韩美举行自由贸易协定联委会特别会议。而美国通过修订这一自贸协定,以减少对韩贸易逆差的愿望能否实现,还是未知数。
鸡胚胎成纤维细胞(CEF ) 在为在鸡宿主和 H5N1 之间的相互作用的学习的最通常使用的细胞之中鸟的流行性感冒病毒(AIV ) 。在这研究,典型地在哺乳动物为量的即时 PCR (QPCR )