论文部分内容阅读
近些年来,我们亲眼目睹了互联网大数据的发展的迅猛势头,信息时代所产生的数据呈现爆炸式增长。在面对错综复杂的海量数据,如何给用户推荐他们理想的物品是目前学者们研究的方向。在没有用户行为数据时,我们根据商品的历史销售数据集,运用算法去预测未来一段时间的销售情况,把预测出的最好销售商品推荐给用户。但是预测值与真实销售量之间误差较大。本文中,主要研究的是如何在没有用户偏好数据情况下做出很好的推荐。首先,提出基于情感分析技术的电子商务推荐研究,将单一用户评论文本情感特征与算法进行训练去预测未来商品销售量,再将预测结果运用TOP K思想进行推荐。提出了1SA-MLR、1SA-STL、1SA-GM和1SA-BPNN四种单一模型,并将上述四种单一模型进行融合,最终提出1SA-ERec(One Sentiment Analysis of E-commerce Recommendation,即1SA-ERec,其中1代表文本评论情感特征)推荐模型。通过实验论证,四种单一模型在平均绝对误差(Mean Absolute Error,即MAE)的均值下降了1.37%,在平均绝对百分比误差(Mean Absolute Percent Error,即MAPE)上的值相比传统算法都减小了,预测准确度有了一定的提高;而且1SA-ERec推荐模型比四种单一模型预测精度更高。在电子商务推荐部分,融合后的1SA-ERec推荐模型在不同K值下准确率比单一模型高。为了进一步验证情感特征的显著性,本文还做了基于情感分析技术的房地产楼盘推荐研究,对情感特征进一步扩展,楼盘对应的评论文本数据和经济数据多个情感特征进行分析,再将多个情感特征与模型训练去预测未来楼盘销售量,再将预测结果运用TOP K思想进行推荐。提出了2SA-MLR、2SA-STL、2SA-GM和2SA-BPNN四种单一模型,并将上述四种单一模型进行融合,最终提出2SA-RERec(Two Sentiment Analysis of Real Estate Recommendation,即2SA-RERec,其中2代表文本评论情感特征和经济情感特征)推荐模型。通过实验论证,在均方误差(Mean Square predict Error,即MSE)和均方根误差(Root Mean Squared predict Error,即RMSE)稳定的情况下,四种单一模型在MAE的均值下降了4.13%,比单一情感特征效果更好;MAPE值都在10%以下,说明相比单一情感特征,多个情感特征进一步提高预测精度,模型鲁棒性加强;并且2SA-RERec推荐模型会比单一模型进一步提高。在楼盘推荐部分,融合后的2SA-RERec推荐模型在不同K值下准确率比单一模型更高。