基于深度学习的文本分类关键问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:treef620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类由来已久,近年来,随着人工智能和机器学习的迅速发展,文本分类也出现了很多新方法。随着技术的发展,一方面,文本语料的数据质量和数量发生了巨大的变化,大规模语料的积累为更复杂的模型提供了必要的数据保障。另一方面,计算机的计算性能的提升为大规模语料的计算和分析提供了有力的计算资源保障。  随着机器学习和深度学习的推进,深度学习的方法在各个领域都表现出强大的优势。  本文将在深度学习的基础上探讨文本分类中的基本研究问题。介绍了不同的深度学习方法,如卷积神经网络(Convolutional Neural Network,CNN)和长短期记忆(Long Short-Term Memory,LSTM)。提出了分别利用CNN和LSTM,并利用朴素贝叶斯(Na(i)ve Bayes,NB)作为对比方法,以PyCharm是开发平台,在文本情感分类的公开数据集上做了实验,并对实验结果进行了分析。结果表明,所提出的方法比基准方法取得了更好的效果。
其他文献
组播是一种“一对多”的通信模式,能够优化网络资源,例如节约带宽资源、减轻网络负载等。而对于无线网状网络来说,最重要的问题也是节约网络资源,提高网络吞吐量。所以,无线
互联网已经成为反映民情民意的动态窗口,越来越多的人通过网络获取信息并在网络空间中表达自己意见和情绪,这些意见、情绪和行为倾向的集合称之为网络舆情。客观准确的判断网络
21世纪的汽车朝着人性化、智能化的方向发展。近年来,云计算、大数据等技术有着和传统行业相结合的趋势。怎样将这些技术合理、合适的应用到传统的生产、制造、金融、交通等传
端到端延时是手机视频通讯应用性能指标中相当重要的一个参数,延时测量的准确性直接关系到通讯产品的质量以及安全。然而现有的一些内部和外部延时测量方法都存在时钟同步、通
敦煌莫高窟游客流量众多,为了进一步加强对莫高窟遗产的保护,对游客流量实时监控具有重要意义。游客流量的监测需求使得对低功耗传感器定位技术的研究成为必需。通过对基于AS39
随着网络的普及和日趋丰富的社交软件的出现,网络作为一个新起的舆论方式已深入人们的日常生活。舆情分析任务涉及分词、聚类、情感分析等相关工作。在这些工作中算法存在效率
基于移动互联网的动漫内容服务已经成为移动互联网领域重要的数据业务,而在终端动漫图片数据处理中,图片存储问题已经成为了一个亟待解决的问题。目前为止,还没有专门针对动
随着人们对业务流程管理的可靠性和正确性要求的提高,科研管理工作流已经成为科研机构实现业务过程自动化的核心技术。建立工作流模型是实现工作流技术的关键环节,模型的优劣
在无线网络的通信过程中,如果数据包长过大,会大大增加数据包的错误率,增加重传次数;如果数据包长过小,会增加包头的比例,降低信道利用率。因此,已有很多工作研究无线网络中数据包