基于语义密度的文本聚类研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户：xzh_endless

【摘要】

：

结合文本数据的语义相似度,给出一种基于语义密度文本数据聚类的方法。根据文本数据的特点,从一个随机选定的文本对象出发,向文本数据最为密集的区域扩张,组织成一个能反映语

【作者】

：

刘金岭

【机构】

：

淮阴工学院计算机系

【出处】

：

计算机工程

【发表日期】

：

2010年05期

【关键词】

：

密度簇邻域聚类

【基金项目】

：

国家自然科学基金资助项目(60632050);2009年度淮安科技基金资助项目“基于语义的垃圾短信分类器设计与实现”(HAG09061);淮阴工学院基金资助重点项目(HGA0907)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

结合文本数据的语义相似度,给出一种基于语义密度文本数据聚类的方法。根据文本数据的特点,从一个随机选定的文本对象出发,向文本数据最为密集的区域扩张,组织成一个能反映语料结构的有序序列进行聚类。在处理噪声文本数据的过程中,利用有效结果重组策略来辅助噪声文本数据重新定位。实验结果表明,该方法具有良好的聚类性能。

其他文献

软粘土地基基坑开挖性状的研究

本文发展了一个可用于分析以板桩为支挡结构的软粘土地基基坑开挖问题的有限元程序。用杭州友好饭店工地的饱和软粘土样进行了四种不同应力路径等向固结不排水剪(CIU)试验,结

期刊

基坑开挖有限元程序侧向位移应力路径粘土地基板桩墙

医疗保险欺诈信号传递博弈分析

基于对医疗保险欺诈动因的分析,建立医疗保险欺诈博弈模型,并研究博弈达到均衡时社会医疗保险合同中相关参数间的关系,为确定最优医疗保险合约提供理论依据。

期刊

保险欺诈信号传递博弈审核

江西省人民政府办公厅关于进一步加强行政执法监督工作的意见

<正>赣府厅发[2014]48号2014年9月29日各市、县(区)政府,省政府各部门:近年来,全省各级政府及其部门坚持依法行政,严格依法办事,法治观念和法律意识不断增强,行政执法行为进

期刊

执法监督人民政府江西省

微创拔牙术应用于下颌阻生智齿的循证医学分析

目的:采用循证医学对用微创技术拔除下颌阻生齿的临床疗效进行系统评价。方法:利用系统评价和Meta分析,计算机和手工检索,对截至2012-10的相关临床随机对照研究文献进行综合

期刊

下颌阻生智齿微创拔牙术Meta分析

新型化工原料双酚──B的合成：硫酸催化法

本文采用硫酸法新工艺，以苯酚和丁酮为原料合成了２，２－二（４－羟苯基）丁烷（简称为双酚－Ｂ）。利用ＨＰＬＣ仪对反应过程和分离提纯的产物进行了分析．使用ＦＴＩＲ光谱法和ＮＭＲ法鉴定了产物的化学结构。

期刊

硫酸法新工艺：2，2－二（4－羟苯基）丁烷：合成双酚－B

社会工作在香港

<正>社工虽然起源于西方国家,香港社工管理模式和运作经验也已经非常成熟。在香港,每562人即有一位社工,远超过西方国家平均每1000人有一位社工的水平。笔者在香港游学,得以

期刊

社会福利署社会福利服务社会工作系社会服务机构

商业银行操作风险管理研究评析

20世纪90年代以来,国内外对商业银行操作风险进行了大量研究。本文在对目前国内外已有的关于商业银行操作风险研究成果进行分析的基础上,对当前我国商业银行操作风险的研究情

期刊

商业银行操作风险研究

论戏剧翻译的“可表演性”原则——以《茶馆》的翻译为例

论文从区别戏剧与其他文学形式、戏剧与戏剧艺术出发,通过对《茶馆》的两个译本的比较分析,试图论证关于戏剧翻译的“可表演性”原则的可行性。

期刊

戏剧翻译可表演性原则《茶馆》

非法占有目的内涵之辨析

分析了大陆法系、英美法和中国大陆的各种观点,阐述了占有的含义、非法占有目的之规范结构、非法占有目的之心理构造、所有权能的组成和财产犯罪保护现状等。非法占有目的指

期刊

非法占有目的规范结构心理构造

三种常用颜色模型的比较研究

首先对三种常用颜色模型RGB、YCrCb和HSV进行了简单的介绍,并给出了RGB与YCrCb、RGB与HSV相互间的转换算法。没有哪一种颜色模型能解释所有的颜色问题,具体应用中常常通过采

期刊

颜色模型基色亮度饱和度

基于语义密度的文本聚类研究

与本文相关的学术论文