基于模糊关系的文本分类特征选择方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
若要有效地实现文本分类,关键是对高维特征空间进行降维,降维方法分为特征选择和特征提取。本文对已有特征选择方法分析后发现,这些方法仅利用文档数来选择特征,没有考虑特征项的权重。为了找出本质特征,我们提出了一种基于特征项与类之间模糊关系的特征选择方法,引入特征项权重来确定其隶属度。采用KNN分类器,在Reuters-21578标准文本数据集上进行了训练和测试。实验表明,宏平均和微平均都达到了最高,分别为81.82%和94.88%,宏平均比IG,CHI提高了4.73%和1.12%,微平均比IG,CHI提高了1.
其他文献
阑尾炎在外科急腹症中属于较为常见的疾病,临床治疗中接近35%的患儿早期诊断比较困难,尤其是小儿异位急性阑尾炎常由于症状不显著而造成诊断困难加大。超声显像检查在敏感性和特异性方面较为突出,应在临床治疗过程中得到广泛运用。现对我院治疗的异位急性阑尾炎患儿12例行B超检查的资料进行回顾分析,报道如下。
腹腔镜疝修补术与传统手术相比具有恢复快、疼痛轻、美容等优点,但亦有手术费用较大的缺点。为了降低费用以利于腹腔镜疝修补术的推广,我院改良术式在腰硬联合麻醉下应用“三点一线”式缝合固定法行经腹腔腹膜外腹腔镜疝修补术(TAPP)87例,取得满意的效果。现与同时期进行的无张力疝修补术102例进行回顾性对照研究,现报道如下。
文本过滤是网络安全领域的一个重要研究课题.基于内容的文本过滤关键在于建立语义层次上的用户模板.本文提出一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)
在语义网络环境下,通常运用不同领域的本体来组织分散于各处的信息资源。为了有效地解决这些分散信息资源的定位和整合问题,本文提出了一种新的本体转换模型,主要从原理和方法论