基于语义分析和改进K-means算法的新闻热点提取方法研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:lengkuhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网及信息技术高速发展的同时网络内容中所包含的信息量也在快速增长。面对快速增长的信息量,如何在大量信息中快速提取关键信息成为国内外学者研究的热点。由于网络内容多以自然语言文本的形式存在,不便于直接提取分析,另外在一段时间内,人们集中关注的事件形成的网络热点信息具有很大的随机性,因此新闻关键信息往往很难精确定义和分类。本文针对网络内容热点信息提取的关键问题展开研究,选取高校新闻作为实验对象,将语义分析方法与改进K-means算法相结合,运用于新闻话题的提取与分析,并基于以上算法设计实现了新闻热点分析平台。本文的主要研究内容有以下几个方面:(1)将语义分析方法应用于文本预处理过程中的词语歧义消除、同义词合并,提高了文本预处理的准确性。(2)提出将基于密度改进的K-means算法应用于话题检测过程中的话题集合筛选与候选话题集合的构建。实验验证了结合相似度计算筛选并提取话题的有效性,并证明了该方法较传统的话题检测算法效果更好。(3)基于提出的算法设计并实现了具有一定通用性的新闻热点分析平台,有针对性的对高校新闻进行了采集与分析。本研究中提出了基于语义分析和K-means算法的网络热点提取算法,并设计实现新闻热点分析平台对算法进行了检验,检验结果表明该方法能够较好的实现对网络内容分析研究的预期效果。
其他文献
凌津奇教授是美国亚裔美国文学研究学者,美国洛杉矶加州大学英文系与亚裔美国研究系终身教授,天津市及天津师范大学文学院特聘讲座教授。凌教授的专著《叙述民族主义:亚裔美
利用玉米深加工制作市场走俏的风味豆腐,是农民创出的一条生财新路。下面将玉米风味豆腐的制作方法作一介绍。
期刊
对于《论语》"礼之用,和为贵"中的"和"的解读,经历了自皇侃、邢昺从礼乐关系的角度讲"和,即乐也","和,谓乐也",到朱熹从礼有体用的角度讲"和者,从容不迫之意",再到王夫之讲"
利用超亲水表面或图案化表面抑制“咖啡环效应”可获得均匀单层分散的纳米粒子阵列的原理,采用“拉膜法”在亲水点上组装PS微球精密单层阵列,结合反应等离子刻蚀(RIE)和磁控
从煤直接液化油中分离主要组分环己烷对于其高附加值化工利用具有重要的意义。本文以芳烃抽提工艺中常用的二甲基亚砜(DMSO)为萃取剂,借助Aspen PLus软件模拟环己烷-异丙苯体