【摘 要】
:
新闻文本信息是我们生活中接触较广泛的一种文本类信息,也是人们了解社会发展的重要手段之一。一方面,人们在进行新闻文本信息浏览,寻找感兴趣的新闻类别时,可能会掺杂其他类,用文本分类技术正确划分新闻类别,可节省用户获取信息的时间;另一方面,互联网公司可对新闻文本进行类别的划分,把不同类别放在不同类别库,根据用户需要进行自动化推荐,节省人力物力,提高效率。深度学习方法在自然语言处理领域的应用越来越广泛。本
论文部分内容阅读
新闻文本信息是我们生活中接触较广泛的一种文本类信息,也是人们了解社会发展的重要手段之一。一方面,人们在进行新闻文本信息浏览,寻找感兴趣的新闻类别时,可能会掺杂其他类,用文本分类技术正确划分新闻类别,可节省用户获取信息的时间;另一方面,互联网公司可对新闻文本进行类别的划分,把不同类别放在不同类别库,根据用户需要进行自动化推荐,节省人力物力,提高效率。深度学习方法在自然语言处理领域的应用越来越广泛。本文利用深度学习的强大优势,将其应用在新闻文本分类领域,具体内容包括:(1)梳理了文本分类的基本流程,分析比较常用的文本分类算法,包括传统机器学习和深度学习算法。(2)针对传统机器学习算法特征工程繁琐的问题,包括文本预处理,文本表示,特征选择等步骤,这极大地增加了分类的工作量;本文提出了基于注意力机制的Text CNN深度学习模型。首先,选取Text CNN作为基础分类模型。然后,卷积层使用多尺度卷积核,池化层使用2-max pooling代替max pooling,同时增加平均池化。最后,在池化层后加入注意力机制,对2-max pooling和平均池化这两种池化得到的深层特征文本进行特征精炼,给予两种池化后特征相应的权重分配,从而把注意力放在那些更能代表文本特征的信息中,提高分类效率。(3)针对Text CNN模型在分类中对上下文信息关注不足的问题。首先,选取LSTM作为新闻文本分类模型,LSTM模型可以通过隐藏层的状态信息来处理上下文特征信息。然后,再通过Attention-Text CNN和LSTM融合,在一定程度上集合两者优势,来构建融合Attention-Text CNN和LSTM的新闻分类模型。最后,在新闻文本数据集上,通过对比实验可以看出,融合模型准确率高于融合前的Attention-Text CNN、LSTM模型,最终达到97.81%。(4)设计并且实现一个WEB端的新闻分类系统,将融合模型嵌入到新闻分类系统中。系统通过多种方式文本输入,输入的新闻文本信息在Attention-Text CNN和LSTM的融合模型中实现分类,得到正确的分类结果,并对结果进行可视化展示,测试完成后,各模块的实现都符合系统设计的要求。
其他文献
4G改变生活,5G改变社会,5G相比于4G,提高了传输速率和频谱利用率,降低了传输时延,增加了系统容量,更加注重用户需求。而Massive MIMO作为5G的一项关键技术,具有传统MIMO无法比拟的优势。论文在研究Massive MIMO关键技术的基础上,针对信道不稳定性影响信号传输的问题,提出了基于传输信道条件数的预编码算法;针对大规模矩阵难以直接求逆问题,提出了基于收敛因子的Neumann级数
对于纪录片创作而言,准确并深入地把握被摄主体的属性是纪录片的重中之重,也是纪录片创作者的应具备的基础素养。社会学家欧文?戈夫曼的“拟剧理论”对理解被摄主体行为属性带来了具有一定参考价值的理论体系。一方面被摄主体会为了表达自我诉求,主动建构起自己的前台角色形象;另一方面,被摄主体为了保持形象的“前后一致”,会出现后台表演行为。为清晰纪录片被摄主体自我呈现的产生过程,研究者以毕业作品纪录片《调解民星》
四月的延安,阳光和煦,春光明媚。由中国延安精神研究会和中国延安干部学院共同主办的纪念中国共产党第七次全国代表大会胜利召开70周年学术研讨会在这里举行。延安是名副其实
在发送端和接收端部署大量天线的MIMO系统当中,频分双工的模式下,用户侧和基站端在通信时会形成上、下行链路,压缩感知能够解决该系统中信道状态信息的反馈问题。同时,压缩感知也是目前无线通信系统信道反馈的重要发展趋势,在现有的研究中,第五代无线通信的发展也不断对压缩感知提出了新的需求。压缩感知可以对稀疏信号进行良好的重构,将其应用于MIMO系统中可以提升信道估计的准确性。另外,信号在信道中传输时往往会
正如各界所反映的那样,政府一直为高等教育的资金投入坚持不懈的做各种努力,一方面体现出我国对教育的重视程度,一方面也印证了国家需要高校培养高层次人才的迫切希望,然而这些投入却滋生出不良的发展态势。前期高校为获得更多资源投入和竞争优势纷纷扩招、扩建,经济活动也日趋多元化,导致高校在财务管理方面的较大挑战。同时,如果高校内部控制制度设置不恰当,落实不到位,高校财务管理风险则更为严峻。这一切,并不是对政府
公共用公物普遍存在于公众的日常生活之中,与之相对应的公物法理论是当代行政法学体系的重要组成部分,其中公共用公物利用权是公物法理论研究的核心所在。在我国,由于行政法学界对公共用公物理论的研究才刚刚起步,现有的行政法体系对利用权的保护又存在着制度不完善的不足,导致了公众的公共用公物利用权常常会受到行政机关的侵害,且现有的法律体系亦不能为权利受损提供充分的救济。鉴于此,构建公共公用公物利用权的行政法保护
飞机液压系统作为飞机的重要组成系统之一,承担着为庞大的飞机各系统提供液体驱动力的重要职责。飞机液压泵作为飞机液压系统的核心动力来源,其性能变化时刻关系着飞机液压系统乃至整个飞机的安全与健康状态。因此,对飞机液压系统关键部件——液压泵的性能变化进行深入研究分析,预测其性能变化趋势,对飞机的安全保障及视情维修都有重大意义,有很高的工程实用价值。本文以飞机液压泵为具体研究对象,经专用的试验平台对其进行性
为了实现智能电网信息互动化要求,我国现在越来越多的智能用电小区采用了电力光纤入户技术(power fiber to the home,PFTTH)。该技术使用光纤复合低压电缆,将光纤随低压电力线敷设,做到电力和光纤网同时入户,节省了二次铺设的成本。因此,PFTTH技术可以说是实现智能电网和三网融合的理想选择。以太无源光网络(Ethernet passive optical network,EPON
消费作为拉动经济的三驾马车之一,不仅是稳定经济运行的“压舱石”,同时也是释放内需潜力,拉动经济增长的“主引擎”。近年来,山西省始终强调消费在促进经济转型发展当中的关键地位,提出了各项促进居民消费的有力措施,但山西省城镇居民消费仍然存在增速下滑、动力不足等问题。要想提升山西城镇居民的消费水平、发挥消费对稳增长的基础性作用,必须剖析山西省城镇居民消费动力不足的深层原因。当前山西省正处于经济转型发展的重
近年来,随着人工智能的发展和机器人的广泛应用,SLAM(即时定位与地图构建,Simulation Location And Mapping)作为其中核心技术,能够让机器人在当前环境未知的情况下,通过自身携带的传感器在运动过程中建立环境地图并且进行定位。本文基于RGBD-SLAM理论进行深入研究,针对室内环境场景复杂、存在动态移动物体的情况,提出具有灵活性、实时性的基于SLAM的移动机器人路径规划与