基于在线评论的情感分析及酒店销量预测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhaojiagu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网技术的飞速进步与完善,越来越多的消费者在线表达购物体会。准确挖掘消费者在线评论情感倾向,对于帮助消费者做出商品选择决策和改善商家服务具有重要意义,而目前的情感倾向预测模型的准确性仍需提高。商家也可以通过分析在线评论的情感倾向,了解消费者的喜好,从而合理地预测产品销量,制定营销方案。因此,如何有效地挖掘和分析在线评论的情感信息并分析其对产品销量的影响是非常有必要的。为此,本文分别从基于集成学习的情感分析,基于深度学习的情感分析及在线评论情感信息对产品销量的影响三部分展开研究,主要研究的内容如下:(1)设计基于集成学习的在线评论情感分类算法,即以N-gram算法分析在线评论词语特征,结合情感词典构造文本特征,以逻辑回归、Light GBM等机器学习方法为基础的集成学习模型进行训练,实现在线评论情感分类,集成学习模型较之单模型分类效果明显提升。实验结果显示,在电脑评论数据集,较之于经典的SVM算法和无监督类算法,该模型的分类衡量指标F1值分别提高了10%到30%不等。同时,在酒店、图书等不同领域的数据集上显示,该方法的分类准确性仍具有上述效果,证明了该方法具有良好的领域移植性。(2)针对集成学习模型依赖特征选择和单模型的运行效率问题,本文利用CNN生成的局部特征和LSTM学习的长距离依赖关系,提出构建CNN-LSTM的情感分类模型。与以往的机器学习模型相比,该模型不需要人工构建特征,而且处理数据的速度快,处理的数据量规模大。不仅可以像卷积神经网络一样刻画局部空间特征,而且可以像长短时记忆神经网络一样建立时序关系,在酒店数据集加权F1值可以达到94%。同时,实验结果表明该方法具有较好的领域可拓展性。(3)设计销量预测模型,利用单条在线评论语句的情感倾向,通过计算情感指数量化阶段时间范围内的整体情感倾向,在此基础上验证了情感指数与酒店销量之间的关系。利用情感指数和前期产品销量作为输入特征,构建基于BLSTM的产品销量预测模型,从而实现考虑消费者情感的产品销量预测。实验结果表明,基于BLSTM的销量预测模型能准确预测产品销量,衡量模型预测效果的评价指标MAPE较之传统的SARIMA、ARIMA、ARMA预测模型分别降低了0.54、0.55和1.27。综上所述,本文研究丰富了在线评论情感分析的方法与理论,有助于产品的销量预测,对消费者和商家均具有较强的实践价值。
其他文献
本文是一篇翻译实践报告,原文选自耶鲁大学林业与环境学院教授奥斯瓦尔德.施密茨的著作:The New Ecology:Rethinking a Science for the Anthropocene(《新生态学:人类世之反思》)。该书是一本生态学科普读物,其目的是为了向广大的读者群解释生态学是一门致力于研究自然界奥秘的科学。译者选取该书的第二章(物种及生态系统的重要性)和第三章(生物多样性及生态系
铜锌超氧化物歧化酶(Cu/Zn superoxide dismutase,SOD1)是一种广泛分布于胞内的重要抗氧化酶,铜离子是催化活性中心,主要功能是催化超氧阴离子(O2·-)歧化为过氧化氢(H2O2)和O2,维持胞内活性氧(reactive oxygen species,ROS)内稳态。有证据表明,DNA能与SOD1结合,通过蛋白质芯片在溶液中发现三条能与SOD1结合的DNA序列;而在细胞内,
国家工业化进程的加快满足了人们对社会发展的要求,同时也破坏了原始的生态环境。化石燃料作为经济和交通的重要依托,其燃烧所产生的大量污染物造成了严重的大气污染,这直接影响到人类的正常生活,也增加了人类患疾病的风险。NOx作为典型的大气污染物,是酸雨、雾霾、臭氧层破坏等恶劣环境问题的根源,因此开发可持续发展的NOx污染控制技术刻不容缓。虽然选择性催化还原法是工业上广泛应用的NOx去除技术,但该技术处理大
蔬菜作为人们日常生活中重要的农副食品,在农村的农业生产和农业经济中占有重要地位。各级政府一直以来十分重视蔬菜产业的健康发展,尤其是乡村振兴战略实施以来,政府着力助推农村发展,调整农业产业结构,并推出了“菜篮子”市长负责制,极大推动了我国蔬菜产业的发展。料庄村蔬菜产业的发展依托自身深厚而悠久的种植基础,借助国家的优惠政策,现今已成为料庄村农民主动投入生产较多、经济收益较高的主导产业之一。蔬菜种植也已
我国经济发展进入新时代要求培育产业增长新动能以促进经济发展,体育旅游是体育产业和旅游产业融合发展所形成的新兴增长动能。与此同时,得益于政策支持,全国逐渐兴起了建设体育小镇的新热潮。运动休闲小镇(即体育小镇)加速了体育产业和旅游产业融合发展,将产业形态由“专业式”体育和“观光式”旅游向“群众性”体育和“体验式”旅游转变。为此,本文立足于现有国内外研究基础,以浙江省杭州市戴村郊野运动小镇作为调研对象,
目的:面对持续的新陈代谢需求,人体需要储存大量的胰岛素来进行能量代谢。胰岛素是由胰岛素前体(前胰岛素原、胰岛素原)经过加工、剪切生成。前胰岛素原跨膜转位进入内质网(Endoplasmic Reticulum,ER),信号肽被剪切后,在ER中经过氧化折叠,生成二硫键,形成成熟的胰岛素原。由于ER是合成胰岛素原的唯一场所,压力负荷大,容易形成错误折叠的胰岛素原,过量错误折叠的胰岛素原在内质网中堆积,会
永磁同步电机模型预测控制是一种高性能的永磁同步电机调速系统控制策略,其产生于工业生产过程控制中,是一种具有动态响应速度快,目标函数配置灵活,易于处理非线性约束问题等
目的:本研究的目的是探讨BMI指数与类风湿关节炎中医证型分布规律的相关性,为类风湿关节炎(RA)中医病情评估及中医针对性治疗提供循征依据,为临床实践工作提供更多的参考依据。方法:将纳入的152例患者参考《2017年类风湿关节炎病证结合诊疗指南》、《中国成人肥胖症防治专家共识》推荐标准进行中医辨证分型,回顾性分析BMI指数与类风湿关节炎中医证型的分布规律。应用标准化的报告表格登记所有患者相关临床数据
膨胀素是一类能够与纤维素酶协同作用,促进纤维素水解的蛋白质。利用膨胀素对木质纤维素进行生物处理,对于提高木质纤维素水解效率、减少纤维素酶用量有着重要的意义。本文利用发酵和纯化的方法制备了重组的枯草芽孢杆菌类膨胀素BsEXLX1,并利用耗散型石英晶体微天平(QCM-D)研究了膨胀素在不同条件下纤维素和木质素薄膜表面的实时吸附/脱附历程,考察了纤维素薄膜处理前后的结构变化,进一步建立了相关的吸附动力学
城市轨道交通是一座城市得以快速发展的重要交通基础,在《上海市城市总体规划(2015-2040)》中曾指出,上海将进一步贯彻公交优先与绿色出行的理念,加强公共交通引导作用,努力