基于情感分析的互联网数据公共意见推荐研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhyj747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,我们亲眼目睹了互联网大数据的发展的迅猛势头,信息时代所产生的数据呈现爆炸式增长。在面对错综复杂的海量数据,如何给用户推荐他们理想的物品是目前学者们研究的方向。在没有用户行为数据时,我们根据商品的历史销售数据集,运用算法去预测未来一段时间的销售情况,把预测出的最好销售商品推荐给用户。但是预测值与真实销售量之间误差较大。本文中,主要研究的是如何在没有用户偏好数据情况下做出很好的推荐。首先,提出基于情感分析技术的电子商务推荐研究,将单一用户评论文本情感特征与算法进行训练去预测未来商品销售量,再将预测结果运用TOP K思想进行推荐。提出了1SA-MLR、1SA-STL、1SA-GM和1SA-BPNN四种单一模型,并将上述四种单一模型进行融合,最终提出1SA-ERec(One Sentiment Analysis of E-commerce Recommendation,即1SA-ERec,其中1代表文本评论情感特征)推荐模型。通过实验论证,四种单一模型在平均绝对误差(Mean Absolute Error,即MAE)的均值下降了1.37%,在平均绝对百分比误差(Mean Absolute Percent Error,即MAPE)上的值相比传统算法都减小了,预测准确度有了一定的提高;而且1SA-ERec推荐模型比四种单一模型预测精度更高。在电子商务推荐部分,融合后的1SA-ERec推荐模型在不同K值下准确率比单一模型高。为了进一步验证情感特征的显著性,本文还做了基于情感分析技术的房地产楼盘推荐研究,对情感特征进一步扩展,楼盘对应的评论文本数据和经济数据多个情感特征进行分析,再将多个情感特征与模型训练去预测未来楼盘销售量,再将预测结果运用TOP K思想进行推荐。提出了2SA-MLR、2SA-STL、2SA-GM和2SA-BPNN四种单一模型,并将上述四种单一模型进行融合,最终提出2SA-RERec(Two Sentiment Analysis of Real Estate Recommendation,即2SA-RERec,其中2代表文本评论情感特征和经济情感特征)推荐模型。通过实验论证,在均方误差(Mean Square predict Error,即MSE)和均方根误差(Root Mean Squared predict Error,即RMSE)稳定的情况下,四种单一模型在MAE的均值下降了4.13%,比单一情感特征效果更好;MAPE值都在10%以下,说明相比单一情感特征,多个情感特征进一步提高预测精度,模型鲁棒性加强;并且2SA-RERec推荐模型会比单一模型进一步提高。在楼盘推荐部分,融合后的2SA-RERec推荐模型在不同K值下准确率比单一模型更高。
其他文献
随着国际贸易的日趋频繁,我国物流行业得到迅速发展。海运货代作为物流业的重要组成部分逐渐发展壮大,已经成为一个比较有竞争力的服务行业。伴随我国海运货代的迅速发展,该
21世纪以来,现代社会的发展与进步,特别是信息技术的广泛应用,推动了我国医疗水平快速提高和医疗信息化建设迅猛发展。但与发达国家相比,仍然存在不小的差距,还远远不能满足
人脸是人们区分不同对象的重要特征之一。人脸识别技术的研究对计算机视觉与模式识别的发展和应用有着重要的意义。特征提取与模式分类是人脸识别系统的两个重要步骤,稳定的
虚拟战场地形环境仿真中,地形模型具有广泛而重要的作用。由于计算机硬件水平有限,制约了大范围三维地形建模的速度和精度。目前解决该问题的方法是基于软件的方法,从建模的角度
自然场景图像中的文本字符是描述和认知场景内容的关键线索,对场景视觉信息的表达和理解具有重要价值。由于场景图像中的文本字符存在于复杂的背景之中,拍摄视角的不同使得文
本文针对双伸位堆垛机立体库的库位编码问题提出了归一化处理思想和单点双向扩展方法,打破了传统的最低能耗思想,建立了两级库位编码,根据入出库货物统计质量的排列和优化后的库位号来指导入出库货物货位的选择,并通过实例模拟验证,结果表明该库位分配优化方法大大节省了双伸位堆垛机的能量消耗,提高了堆垛机的周转频率及效率,有效地解决了新型立体库的库位配置问题。针对双伸位堆垛机拣选作业的路径行走特点,把拣选作业归结
问题扩展,即根据用户查询意图,在原始查询基础上通过添加更有利于改善检索结果的词、词组或者短语,或通过改写重构,使得检索结果更满足于用户查询意图。问题扩展的原因在于查
在这篇文章中,我们研究一种新型的空间查询,叫做聚集k最远邻居查询(Aggregate k Farthest Neighbor Query,简称AkFN Query).给定一个数据点集P和一个查询点集Q,AkFN查询返回P
随着计算机技术的不断发展,各种应用需求的不断提高,目前应用服务系统及其所依存的网络环境变的越来越复杂。在应用需求提高的同时,用户对应用服务提供的稳定性要求也日益提
无线传感器网络(WSN),是一种分布式的,使用无线通信方式传递数据的网络,包含大量低性能、低成本的传感器节点,具有一个或多个中心,并且网络中传感器节点可以通过一些算法进行