基于集合运算特征提取及Stacking策略的新闻多分类方法

来源 :井冈山大学学报:自然科学版 | 被引量 : 0次 | 上传用户:godwin_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是机器学习重要任务之一,如何对文本信息进行有效分类组织,对用户查找并获取有用信息具有重要作用。针对新闻文本分析,提出了一种基于集合运算特征提取及Stacking策略的新闻多分类方法,该方法基于集合运算的方法来提取文本特征,采用Stacking策略,使用SVM以及贝叶斯方法来对文本进行分类。与典型同类方法对比,在复旦大学文本分类数据集上的实验结果表明,该方法随着样本数增加,各分类指标逐渐升高并趋于稳定。
其他文献
2016年6月底~2019年7月中旬,对信江上游及其支流的鱼类资源进行了系统地调查。共采集到野生淡水鱼类66种,隶属于5目16科50属,其中以鲤形目鱼类种类最多,共计3科34属45种,占总
柿黑染与莨纱绸泥染分别是日本、中国精湛的传统天然染色技艺,文化内涵丰富,发展潜力巨大。文章在前人研究基础上,结合实地调研和体验,采用对比研究法对柿黑染和莨纱绸泥染的
采用高效液相色谱-质谱法(HPLC-MS)对冠状动脉慢性完全堵塞(CTO)患者在不同患病阶段的血清试样进行了脂质组学研究。试验采集了CTO疑似人群、CTO患者及CTO患者经皮冠状动脉介
基于"共混纺丝"原理,文章以聚丙烯腈为基材,以药物姜黄素和维生素E醋酸酯作为添加剂,旨在制备一种差异化多功能长丝纤维。在纤维制备过程中以"相似相溶"为理论基础选择适当的
采用QuEChERS结合超高液相色谱-串联质谱法(UHPLC-MS/MS)测定了洋葱、葱、韭菜、蒜薹、生姜和大蒜等6种高硫蔬菜中16种氨基甲酸酯类农药残留量。样品用冷冻后的乙腈涡旋提取,
针对基于几何矩及不变矩的图像特征描述存在信息冗余,计算复杂,图像表征能力不强等问题,本文深入研究了正交的Gaussian-Krawtchouk矩及其不变矩的表达形式。依据不同的尺度因子特点,提出了基于多尺度Gaussian-Krawtchouk不变矩的图像局部特征描述方法,并用于五种不同类型图像的特征匹配。实验结果表明,这种不变矩较其他传统的特征描述方法具有更好的图像表征能力,更强的数字稳健性。该
脑中风是我国临床常见病、多发病,数据统计超过50%脑中风患者在发病后存在不同程度的功能障碍,足内翻是最常见的下肢运动功能障碍,其发生率占17%~43%,足内翻影响行走的效率与
剖宫产是产科中较为常见的分娩方法,常应用于产程迟滞、妊娠胎儿窘迫、胎位不正、多胞胎以及严重妊娠并发症等不适宜自然分娩的孕产妇[1]。近年随着不适宜进行阴道自然分娩的
为了研究中空咖啡碳聚酯纤维的可纺性,文章测试并分析中空咖啡碳聚酯纤维的形态结构、红外光谱、热稳定性、拉伸性能、吸湿性、卷曲、比电阻、含油率等,并与咖啡碳聚酯纤维、
建立了高效液相色谱法快速测定果蔬脆片中苯并(a)芘残留量的方法。样品经正己烷提取,苯并(a)芘分子印迹柱净化后,经Eclipse Plus C18色谱柱(150mm×4.6mm,5.0μm)分离,以