CHI统计相关论文
股票研报是由金融行业分析师对股票相关新闻作出的分析和评价,它从专业角度分析此类新闻是否会对某股票的未来走势产生影响,并提出......
为了克服传统的CHI统计方法存在特征项出现频率与类别负相关的情况和某一个特征项存在于某一个文本中的概率问题,针对传统的CHI统......
特征选择是基于内容的垃圾邮件过滤的重要过程,它有效地改善过滤效率和精度。文中分析了IG和CHI应用到垃圾邮件过滤中存在的不足,设......
文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题。从特征选择优化和分类器性能提升两方面出发,提出了一种组合的不......
随着信息技术的快速发展,网络上每天产生的文本数据量在以指数形式递增,致使文本分类系统中出现“维度灾难”和特征稀疏性高等问题......
提出了一种面向中文敏感网页识别的文本分类方法,主要包括中文分词、停用词表的建立、特征选择、分类器等4个部分。为丰富中文分词......
提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题......
计算机技术的飞速发展和信息化的不断推进,保密工作面临的问题日趋凸显,而定密工作是保密工作的源头性和基础性工作,决定了保密工......
如今,人们常常通过各种社交网站上发表的消息来了解当时的热点事件、社会舆论等。随着科技的快速发展,微博也逐渐普及,越来越多的......
分析了与类别信息有关的CHI统计特征选取方法和与类别无关的文档频率特征选取方法,在此基础上提出文档频率与CHI统计相结合的特征......
特征选择在整个中文文本分类过程中具有重要作用。国内现有的对于特征选择方法的研究主要关注于各特征选择方法在类分布均匀语料集......
近年来,随着因特网飞速发展,网络上以网页为载体的各种文本信息大量涌现,网上信息量呈爆炸性增长。人们要找到自己所需要的信息犹......
分析了影响传统CHI统计方法分类精度的因素,去除了特征项与类别负相关的情况。同时将改进后的方法用于特征词的权重调整,使其分类......
特征选择是文本分类过程中非常重要的环节。CHI统计是一种经典的特征选择方法,针对CHI统计方法存在的不足,一方面,为了兼顾特征项的文......