基于随机森林与特征提取算法的试验文本分类算法研究

来源 :军民两用技术与产品 | 被引量 : 0次 | 上传用户:wdongjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和试验信息化技术的进步,如何对快速增长的海量试验文本进行自动分类成为了亟待解决的问题.本文在构建试验文本特征表示模型的基础上,结合特征提取算法和随机森林,形成了试验文本分类算法.横向与kNN、SVM、NNet等几种分类模型进行了对比实验,纵向对使用/不使用特征提取算法的随机森林分类器进行了对比实验.实验表明,本文提出的试验文本分类算法具有较好的分类性能和稳定性.
其他文献
技术启示是判断要求保护的发明对所属领域技术人员来说是否具有显而易见性的依据和关键,同时也是创造性评述三个步骤中最为核心的步骤.但相对于'三步法'中前两步的较
“先锋派”舞蹈这个词在舞蹈界出现最为密集的时段正是被运用到后现代舞发展的过程中,代表了那些具有先锋意识和“叛逆”的舞蹈家们,以及后现代舞的特质与表征。后现代舞大师
随着当代教育理论、理念的不断深入与研究视角的不断拓展,越来越多的高效课堂得以展现,成为了学困生的福音,作为教育工作研究者和一线教师密切关注的学困生的成功案例也不断
目的 研究鼻咽癌原发灶两最大垂直直径乘积(两径乘积)、三垂直直径乘积(三径乘积)与体积的相关性,探讨以两径乘积及三径乘积代表体积的可行性。方法 选取治疗前行MRI检查并经