基于语义密度的文本聚类研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:xzh_endless
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合文本数据的语义相似度,给出一种基于语义密度文本数据聚类的方法。根据文本数据的特点,从一个随机选定的文本对象出发,向文本数据最为密集的区域扩张,组织成一个能反映语料结构的有序序列进行聚类。在处理噪声文本数据的过程中,利用有效结果重组策略来辅助噪声文本数据重新定位。实验结果表明,该方法具有良好的聚类性能。
其他文献
本文发展了一个可用于分析以板桩为支挡结构的软粘土地基基坑开挖问题的有限元程序。用杭州友好饭店工地的饱和软粘土样进行了四种不同应力路径等向固结不排水剪(CIU)试验,结
基于对医疗保险欺诈动因的分析,建立医疗保险欺诈博弈模型,并研究博弈达到均衡时社会 医疗保险合同中相关参数间的关系,为确定最优医疗保险合约提供理论依据。
<正>赣府厅发[2014]48号2014年9月29日各市、县(区)政府,省政府各部门:近年来,全省各级政府及其部门坚持依法行政,严格依法办事,法治观念和法律意识不断增强,行政执法行为进
目的:采用循证医学对用微创技术拔除下颌阻生齿的临床疗效进行系统评价。方法:利用系统评价和Meta分析,计算机和手工检索,对截至2012-10的相关临床随机对照研究文献进行综合
本文采用硫酸法新工艺,以苯酚和丁酮为原料合成了2,2-二(4-羟苯基)丁烷(简称为双酚-B)。利用HPLC仪对反应过程和分离提纯的产物进行了分析.使用FTIR光谱法和NMR法鉴定了产物的化学结构。
<正>社工虽然起源于西方国家,香港社工管理模式和运作经验也已经非常成熟。在香港,每562人即有一位社工,远超过西方国家平均每1000人有一位社工的水平。笔者在香港游学,得以
20世纪90年代以来,国内外对商业银行操作风险进行了大量研究。本文在对目前国内外已有的关于商业银行操作风险研究成果进行分析的基础上,对当前我国商业银行操作风险的研究情
论文从区别戏剧与其他文学形式、戏剧与戏剧艺术出发,通过对《茶馆》的两个译本的比较分析,试图论证关于戏剧翻译的“可表演性”原则的可行性。
分析了大陆法系、英美法和中国大陆的各种观点,阐述了占有的含义、非法占有目的之规范结构、非法占有目的之心理构造、所有权能的组成和财产犯罪保护现状等。非法占有目的指
首先对三种常用颜色模型RGB、YCrCb和HSV进行了简单的介绍,并给出了RGB与YCrCb、RGB与HSV相互间的转换算法。没有哪一种颜色模型能解释所有的颜色问题,具体应用中常常通过采