基于同义词词林的文本特征选择方法

来源 :厦门大学学报(自然科学版) | 被引量 : 0次 | 上传用户:cttc_tom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实
其他文献
梅子编辑的《关于鲁迅》,被视为抗战时期“敌意鲁迅”的代表性作品。其中所收七篇文章,在承认并肯定鲁迅文学天才的同时,对其政治上的左翼倾向,也大加攻击和否定。《关于鲁迅》是
当中式遇上现代,当传统遇上时尚,当古典语言用现代手法来诠释……于是空间随之散发出淡然悠远的人文气韵。这种风雅意境的缔造者便是时尚与传统的结合体----改良中式,它将东
眼科学基础是眼视光技术专业的核心课程,理论知识较多,难以掌握,教学中难免枯燥、乏味,为了使学生更好地掌握这门课程,本文将思维导图运用于眼科学基础课程的理论教学中,对其
中国的古典文化光辉绚烂,享誉世界,中国古代的设计也在世界上独树一帜,然而近代以来中国由于种种原因,其设计的发展已远远落后于一些经济发达国家。近代西方国家从工艺美术运
指出了新时期下,随着社会经济的快速发展,生态环境也受到了严重的破坏,这也对社会的可持续发展带来了极大影响。故生态环境保护中植树造林是十分重要的手段,在全面加强对植树
据台湾联合新闻网2019年8月20日报道,为打击大陆渔船“越界”捕捞,台湾“海巡署”针对性开展巡逻。澎湖“海巡队”今在澎湖七美乡附近海域,发现一艘“越界”的大陆油料补给船
期刊
近年来,随着我国社会经济的快速发展,使我国石油化工产业的规模不断扩大。在石油化工建设工程项目施工过程中,会涉及到大量的施工作业人员、设备以及材料等。这使得石油化工
不等式是中学数学的重要内容,综合性较强,难度也较大,在历届高考中占有较大的比重.考查内容包括不等式的性质、不等式(含参不等式)的解法、不等式的应用.新课标试题中不等式的分量更
植树造林技术与森林养护一直以来都是各地林区的重要工作要旨,河南省三门峡灵宝市拥有丰富的林业资源和国家级自然景区,整体来看林业资源非常丰富,是典型的林业资源大县和山
靖边气田从2006年开始广泛采用水平井,到2011年3月已完钻水平井20口,其储层的改造方式以笼统酸压为主,通常采用水平段连续油管拖动布酸+油管酸压,该工艺对短水平段水平井效果较好,