【摘 要】
:
【目的】基于用户网络评论构建有效的评分预测模型,挖掘用户消费行为特征。【方法】基于LDA模型,量化用户评论为主题特征向量作为解释变量,将用户评分作为被解释变量,采用XGB
【机 构】
:
天津财经大学中国经济统计研究中心; 天津财经大学理工学院;
【基金项目】
:
国家自然科学基金面上项目“劣者淘汰两阶段自适应临床试验的设计和分析”(项目编号:11471239);国家社会科学基金青年项目“社交媒体中敏感信息可信度评估方法研究”(项目编号:18CTJ008);全国统计科研计划重点项目“Web社会网络中敏感信息识别及突发事件预测研究”(项目编号:2017LZ05)的研究成果之一
论文部分内容阅读
【目的】基于用户网络评论构建有效的评分预测模型,挖掘用户消费行为特征。【方法】基于LDA模型,量化用户评论为主题特征向量作为解释变量,将用户评分作为被解释变量,采用XGBoost算法,并加入样本扰动和属性扰动生成多个模型进行集成,构建用户评分预测模型。【结果】针对某汽车门户网站的用户评论评分预测结果表明,该模型较好地揭示了用户对汽车商品的偏好。较逻辑回归、随机森林算法,其预测准确度分别高出13.73%、0.64%,且具有较高的计算效率。【局限】未融合其他方面的数据对用户行为特征进行更全面的刻画。【结论】将用户评论量化为主题特征向量,基于XGBoost算法能够准确、高效地预测用户评分。
其他文献
港珠澳大桥跨越珠江口伶仃洋海域,远离陆地,施工作业线长达3km,距岸最近为27km,运输线路长,工程建设周期长,而东人工岛为外海人工岛,规模宏大、内容多、专业广,涉及人员数量
目的骨关节炎(OA)是人类中最常见的关节炎类型,常伴有软骨缺损、滑膜炎、软骨下骨硬化等相关改变。OA治疗通常涉及使用非甾体抗炎药(NSAID),这是首选的药物治疗方法。然而,NS
学生消费情况一直是社会和院校学者关注的问题,但是对于高职学生消费情况的研究文章尚少,职校中高职生的队伍越来越壮大,对于本群体的消费情况进行问卷调查,专家访谈发现,高职生的
装饰装修工程是高铁站房工程的重要环节,通过对站房各部位的施工图进行深化设计,以及在施工管理中严格执行了样板领路、材料验收制度、技术交底等控制措施,做到了超前策划、
港珠澳大桥珠澳口岸人工岛陆域形成选用何种回填料作为筑岛材料曾让诸多专家和学者困惑。珠澳口岸人工岛填海回填材料可选种类众多,包括开山土石、砂、淤泥、惰性拆建物料等
为了更好地发挥心理健康教育课程在高职院校心理健康教育工作中的主渠道作用,在新时期需要对该课程进行改进,以帮助学生体面就业。通过分析当前高职院校心理健康教育课程存在