基于卷积神经网络的高精度文本分类方法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:wac725725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文给出了一种基于卷积神经网络的高精度文本分类方法,其思路是:读取数据集进行分词和停用词处理,将处理后的语料库送入统计共现矩阵,训练出词向量,进而保存向量矩阵,最后把矩阵向量集导入卷积神经网络进行分类处理得到预测结果。该方法包括五个步骤:步骤一,将源数据集预处理成为统一格式,再进行分词处理。步骤二,将数据集送入训练glove模型,保存模型;步骤三,将语句以词向量的矩阵形式保存为数据集;步骤四,将数据导入文本分类CNN模型训练;步骤五,用训练好的模型对数据进行分类并与标准进行比对。仿真结果表明,本文所给出的
其他文献
如果说教学质量是学校的生命,那改革创新则是腾飞的翅膀。随着社会的发展,农村教育布局调整和学生数量减少,教学模式就得发生变化,小班化教学使学生人数过少的班级产生了一种
"校本课程开发"研究在我国的起步较晚,职业教育校本课程开发的研究始于世纪之交。通过对职业教育校本课程开发研究的相关文献检索,从内容上进行梳理,考察过往十年研究取得的
大吨位整孔预制箱梁由于体量庞大及水泥用量高等特点易产生早期裂纹,影响箱梁的力学性能及耐久性能。文中依托某高速公路项目实际工程,分析了预制箱梁不同种类早期裂纹的产生
从矿体特征和矿石质量方面入手,详细地对姥山冶镁白云岩及)台金用白云岩矿进行了研究,得出了姥山)台镁白云岩及)台金用白云岩矿储量的估计值,指出姥山矿床开发项目具有较强的盈利能
目的利用计划行为理论探讨冠心病患者戒烟意向的影响因素,为促进冠心病患者戒烟工作开展提供参考。方法 2011年7月至2012年2月,采用方便抽样方法对北京市2所三级甲等医院心血
托尼.莫里森是当代最重要的小说家之一,也是文学界首位获得诺贝尔文学奖的美国黑人女作家。她的作品中时刻能感受到对黑人历史与命运的关注。本文从女性主义视角出发,分析并
中小企业存在着巨大的金融服务需求,但中小银行在缓解其融资难上的作用微乎其微。本文利用保定市中小银行与中小企业相关调研数据,发现问题,分析原因,并有针对性地提出对策建
语言中的代词在句法上的语义及结构特性往往受句法规则的严格限制。生成语法中“约束理论、X—标杆理论、格满足”三条句法规则可以准确地揭示和阐释法语luimême 在同位结构中的
<正>实施背景近年来,随着我国煤炭价格逐步开放,市场化程度提高,发电企业面临着生产成本上升、外来电大增、发电产业边际效益下降、用电量趋于饱和的不利环境。"十一五"期间,