基于用户评论的自动摘要的研究和分析

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:huaqizhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务在迅猛发展,网络信息日益增多。随着越来越多的人在网上购物,如何提高用户体验加强商家与用户、用户与用户之间的信息交流成了一个重要的问题。用户购物后留下的评论是用户之间和用户与商家之间信息反馈的重要平台,因此本文提出了对用户评论进行研究。对用户评论的挖掘和传统的文本挖掘有所不同,因为用户评论一般远远短于普通文本长度,聚焦的信息点更细。这其中涉及了很多自然语言处理,机器学习和数据挖掘的技术。随着机器学习的发展,特别是深度学习的兴起,很多问题都得到了进一步的深层次研究。本文结合自然语言处理基础知识,关联挖掘算法,层次聚类模型,神经网络和决策树算法等对评论自动摘要做了新的研究。本文针对中文的特性,对提取英文中评论特征的Apriori算法做了改进,取得了不错的效果,证明了该方式的可行性。提出了使用词激活力模型对评论特征聚类,比传统聚类模型有更强的适用性。针对评论句的情感分析,基于word2vec使用了递归自编码的神经网络,比传统朴素贝叶斯分类器,F1值提升了大约8%。最后提出使用决策树建立特征的层次模型,更好的组织了摘要的展示。
其他文献
进入新时期后,人们生活水平逐渐提升,对电力需求越来越大。电力企业需要不断提升服务质量,积极运用先进的信息化技术,构建用电信息采集系统,提升电力营销的整体效益和质量,促
"国以人兴,政以才治",科技的竞争说到底是人才的竞争,要想在科研领域占有一席之地,必须拥有高素质的科技人才.面对竞争激烈的新形势,农科教工作显得尤为重要.
<正>农村是金融业态与金融服务的"贫困区"。受制于城乡二元结构的影响,我国农村地区的金融活跃程度远远低于城市。近年来,我国积极推动深化农村金融改革,不断完善扶持政策,积
目的:探究剖宫产术后压疮发生原因分析及护理措施。方法:选取我院收治的296例需进行剖宫产手术的孕妇,将所有孕妇随机平均分成两组。给予所有产妇常规护理措施,对于发生压疮
阐述了应力计算的重要性,利用应力分析软件CAESAR II对聚酯装置中的熔体管道进行设备管道建模及应力分析,通过不同的管道走向及管架的设置方案对比,得出了柔性较好,满足管口
创新是生产企业生存发展的根本,近年来随着企业创新意识的不断增强,更多的企业加入到技术创新的领域中来。但是传统的关起门来搞研发的模式已经不能适应日益激烈的市场竞争。