基于样本密度加权的神经网络分类器在文本分类中的应用

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:q158743153
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高文本分类精度,根据训练集的样本密度的不同,提出了一种基于k最近邻密度估计的样本加权算法,从而使得样本密度较大的样本权重得到加强,处于样本密度平均水平的样本权重保持不变,而样本密度较小的样本权重得到减弱。并将这种方法所构成的神经网络分类器用于文本分类。实验结果表明,这种方法可以在一定程度上提高文本分类精度,优于原始的未加权的分类方法。
其他文献
一次一次地回顾起过往,总告诉自己必须认真地过好现在。然而却总会在轻翻相册时微笑着流泪。那些曾经的过往构成了生命中最美好回忆,会一步步随着时间沉淀成最美味的佳酿。喜欢
原来“告老师”也可以是—件很伟大的事情我跟苏羽结下”兄弟”义气,是在一个有蛋筒色阳光的清晨。我骑着除了铃铛之外哪里都会响的单车在一条条街道上飞驰而过,无心欣赏两旁槐
开封市祥符区是一个农业大区,全区耕地面积8万hm2。小麦是该区的主要粮食作物,常年种植面积6.67万hm2。为了夺取小麦丰收,全区农民采取各种措施和小麦病虫害进行了长期的斗争,取得
从资源环境价值观的角度对农地价值的构成进行分析,得出农地不仅具有市场价值,而且具有巨大的非市场价值。以此为基础,对传统决策模式进行理论优化。认为要协调农地保护与城市化之间的关系,促进经济社会的可持续发展,农地城市流转的直接决策者必须将农地的非使用价值与外部性纳入决策框架。
针对USB通信易受外界干扰而出现异常的问题,论述了强电干扰对USB通信的影响,并提出了一种基于API的自动恢复USB通信的方法。该方法能在USB受到强电干扰,出现通信异常后自动恢复USB的通信,并能使开发人员无须关注USB的底层驱动和协议,从而高效快捷地开发USB设备。
1地理标志的概念和特征世贸组织于1994年通过的《与贸易有关的知识产权协议》(TRIPS协议)第22条第1款规定:“本协议的地理标志系指下列标志:其标示出某商品来源于某成员地域内,或来源于该地域中某地区或某地方,该商品的特定质量、信誉或其他特征,主要与该地理来源相关联”。我国在2001年10月新修订的《商标法》中也增加了地理标志的有关内容,其中第16条第2款明确规定:“前款所称地理标志是指标示某商
用软件工程方法规范应用软件的管理建设银行深圳市分行计算机应用管理处郭彦坤一、建行深圳分行电子化现状在向商业化银行转变的过程中,建行深圳分行以金融信息电子化为基础,依
在日本游玩时,特别是在东京、京都,经常会走在高楼大厦之间看到街边立着个不大起眼的木牌。走近看,上面写着诸如"坂本龙马遇刺处""本能寺事变处"等等,抬头看却发现早已不是当时建
为研究"茂施缓释肥料"在冬小麦生产上速效肥料与缓释肥料配比的合理性,摸索缓释氮肥与磷肥、钾肥的合理配方,规范肥料用量和使用方法,特安排本试验。一、材料与方法(一)供试材料2
本文介绍INFORMIX-Online动态服务器的分布式数据处理所涉及到的若干问题并简单叙述两阶段提交协议的原理。