基于多特征融合的在线商品评论有用性分类研究

来源 :广东财经大学 | 被引量 : 0次 | 上传用户:maxchou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务的快速发展,使得线上购物用户与日俱增。作为电子商务平台重要组成部分的在线商品评论为用户提供了额外的商品信息,辅助用户决策。然而大量的用户使得在线商品评论数量呈爆炸式增长,导致相对有用的优质评论难以被发掘,因此研究如何准确高效地判断评论的有用性有着重要的实际价值与意义。目前国内外对于评论有用性的研究主要集中于有用性影响因素,即评论有用性特征的构建与选择,其中主要包含了两类,一类是从评论的附带属性出发,通过对数据集进行统计分析构建的外部特征因素,另一类是利用作为评论主体的评论文本构建的文本特征。经文献研究分析,外部特征与文本特征均是判断评论有用性的重要影响因素,应当将两者综合起来考虑。本文根据评论有用性影响因素的相关研究,从评论、评论者、评论商品三个角度出发,构建了文本长度、评论评分、评分偏移值、评论可读性、评论商品相关性、评论者可信度、评论者经验值、评论发布时间偏移8个外部特征以及1个文本特征。提出使用Bert结合多层神经网络对文本特征进行有监督的降维处理,通过集成学习算法将外部特征与降维后的文本特征相结合,构造分层的多特征融合模型,在充分考量外部特征与文本特征的同时避免了特征数量的不平衡问题。为了验证模型的效果,本文构造了两组对照试验,第一组包括Bert结合多层神经网络分类模型实验、简单特征融合分类模型实验、多特征融合分类模型实验以及TextCNN分类模型实验,第二组实验包括PCA分类模型实验和LDA分类模型实验。根据两组实验结果,多特征融合的分类模型效果更好,说明外部特征与评论文本特征分层式融合能够有效提高评论有用性识别的效果,而且Bert结合多层神经网络的文本特征降维能够更好地提取文本信息进一步提高模型的准确度。
其他文献
钛合金因具有比强度高和良好的耐蚀性等特点,在航空航天、海洋和生物医学等领域得到了迅速发展及应用。以Ti6Al4V钛合金为例,作为一种典型的α+β钛合金,其应用总量超过钛合金应用总量的60%。其良好的耐蚀性是由于材料表面易形成钝化膜,但在潮湿、多雨、沿海等地区,钝化膜会发生破裂,进而对合金产生腐蚀作用。钛合金常用的加工工艺有铸造、锻造、轧制以及3D打印等,不同工艺制备的材料其微观组织存在明显差异,另
1989年,法国物理学家P.Coullet提出这样一种光场,其具有类似流体动力学中涡旋的性质,并把它命名为光学涡旋(Optical vortices)。1992年,涡旋光最重要的性质,即携带轨道角动量(OAM),被英国物理学家L.Allen发现,这类光束的典型代表就是拉盖尔-高斯(LG)光束。光学轨道角动量概念的提出焕发了涡旋光束在理论探究和实际应用上的强大生命力。涡旋光在光通信、量子纠缠、新的非
细胞是生物体生命活动的基本单元。传统的细胞研究受限于单细胞分离分析技术的缺失与检测方法灵敏度的不足,通常以群体细胞的平均分析结果获取细胞的相关信息,其难以分辨细胞个体的差异,容易导致信息的稀释或丢失,进而影响分析结果的准确性。单细胞分析是一种在单细胞水平上对细胞中物质组成及形态进行研究的分析方法,其能够对细胞间的差异性有更加深入而清晰的了解,为生命科学研究提供更多维度、更加精准的信息。但单细胞含量
近年来,随着我国社会经济的发展、新医改的持续推进以及社会各种保障制度的不断加强,人民群众健康水平和健康意识都得到极大提升,对健康的需求日益增加。习近平总书记在十九大报告中提出:“人民健康是民族昌盛和国家富强的重要标志,要完善国民健康政策,为人民群众提供全方位全周期健康服务”。但是卫生资源的有限供给和人民群众日益增加的健康需求之间存在着供需关系的矛盾并且这一矛盾将会长期存在,而所有卫生资源中卫生人力
锂离子电池在日常生活中有着非常普遍的应用。如何改进锂离子电池的续航本领、充放电速率和安全性,一直都是该研究范畴的难点和热门。三维石墨烯比表面积大、电子导电率高、机械强度高和具备优于石墨的储锂本领,是一种理想的改进锂离子电池电化学稳定性的材料。硅具有4200 mAh g-1的理论比容量,是非常有潜力的负极材料,但硅在充放电循环中会发生高达300%的体积膨胀,本工作制备出了“三明治”结构的三维石墨烯/
目的通过构建大鼠胫骨骨癌痛(bone cancer pain,BCP)模型,观察BCP进展过程中脊髓M1型小胶质细胞活化数目及其相关促炎因子的表达情况,进而探究高乌甲素(lappaconitine,LA)治疗BCP的可能中枢镇痛机制。方法(1)实验一:雌性SD大鼠18只,随机分为3组,每组6只;正常组(Ctrl组):不做任何处理;假手术组(Sham组):于右侧胫骨腔内注射热灭活的癌细胞PBS悬浮液
为使氨(NH3)燃料充分发挥储氢(H2)储能和降低碳排放的作用,本文以燃气锅炉为典型的热力设备,重点研究了氨用于现有燃气锅炉中时操作工况、燃烧能效和排放的改变,燃烧方式包括化石燃料掺氨和掺氢降碳燃烧,以及氨/氢零碳燃烧。研究的化石燃料包括丙烷和甲烷。本论文从理论上研究了丙烷、甲烷掺氨降碳燃烧与丙烷、甲烷掺氢(氢来源于氨裂解)降碳燃烧的进料、烟气特性与环境效益等差异,为设备改造提供理论依据。结果表明
龙应台是蜚声海内外的台湾作家,她的作品一经刊发便引起广泛关注和热烈讨论,屡创文化出版界的奇迹。本文拟采取“作家论”的形式,通过作品解析来考察地龙应台的生平事迹、思想状态、价值取向和情感体验,力求尽可能完整地为读者展现一个“全面”的龙应台。第一章主要分析上世纪八十年代龙应台的社会批评杂文,阐述了龙应台以犀利的批评文章冲破时代政治的帷幕,成为孤勇的“文化英雄”,招致台湾社会严厉批判的创作历程。第二章主
现代航空发动机朝着大推重比、高可靠性、低污染方向发展,对燃烧室的设计与研制提出了更高的要求。燃烧室出口温度场是航空发动机重要的参数之一,然而先进发动机燃烧技术所具有的强旋流等特征使得传统的接触式温度测量无法满足精确捕捉其湍流流场温度变化的需求。可调节半导体激光吸收光谱技术(Tunable Diode Laser Absorption Spectroscopy,TDLAS)作为新型的吸收光谱测量技术
近年来,我国政策及市场的逐渐利好以及中国企业在海外市场的一系列碰壁经历,使不少中概股萌生了回国上市的想法,扭转了中国企业奔赴海外上市的趋势。然而,随着中概股回归的队伍逐渐壮大,伴随的问题开始暴露,如回归对企业的影响、监管政策的不完善等。针对这一现象,可参考的文献大多研究的是中概股私有化的动因及回归后的财务绩效,对不同路径下的回归分析较少。本文在此背景下,从已回归的中概股入手,分析企业选择相应回归路