在线用户评论驱动的创新设计产品属性提取方法与情感分析研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:albeewang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,线上购物普及,顾客在电商平台上对产品的评论数量不断飙升。通过分析在线用户评论,提取产品属性和挖掘用户对产品属性的情感偏好对于进一步改善产品的功能、质量和提升用户的满意度,支撑产品的设计过程以及为设计者对于产品设计决策的制定提供了重要的依据。本论文提出一种基于产品属性特征加权(Product Attribute Feature Weighting,PAFW)的方法来进行产品评论属性提取和情感偏好智能分析,以提高产品的设计质量,缩短产品的研发设计周期,降低设计成本,改善用户的用户体验和提高用户满意度和产品市场竞争力。本论文提出基于产品属性特征加权(PAFW)的研究和分析方法,包含了如下几个方面的内容:首先,提出基于词频逆文档频率-卡诺(TFIDF-Kano,TIK)模型,来对产品属性关键词的自动识别和提取;然后,对双向长短时记忆条件随机域模型(Bi-LSTM-CRF)的改进,使用改进后的深度学习模型(TIK-PAFW)与多种深度学习模型进行产品属性提取的对比实验和结果分析;最后,基于提出的PAFW方法,对多种深度学习模型引入权重化方法(CTI)与原有的模型进行产品评论情感分析的对比实验和结果分析。本文主要研究内容如下:1.针对传统的手动或半自动文本关键词提取时,人工成本高、提取效率低等问题,本文提出一种基于TIK模型的产品属性相关关键词自动提取方法。首先,通过词频逆文档频率方法中的词频统计,计算文档中的频率较高的词语;再把文档分为多个子文档,计算逆文档频率的值,可以避免通用词对关键词造成的影响,再每个词的词频逆文档频率值。然后,使用卡诺模型对关键词进行产品属性相关性分析,筛选产品属性关键词。最后,通过实验验证,关键词提取的TIK模型是有创新性的探索和方法,可以精确、高效的实现关键词的自动提取。2.针对目前人工分析产品评论来提取文本中重要信息的低效率和高成本问题,本文提出基于PAFW方法,结合产品属性提取的TIK模型对Bi-LSTM-CRF模型进行改进,构建了加权长短记忆神经网络(TIK-PAFW)模型,并和HMM、CRF、LSTM、Bi-LSTM进行对比实验,验证了改进后的TIK-PAFW模型在以手机为例的自建电商评论数据集上有较高的产品属性关键词提取准确率、召回率和F1。构建的加权长短记忆神经网络模型的准确率为93.89%,召回率为94.52%,F1为94.60%,在几种模型中达到最高。最后,通过实验结果,得出基于PAFW实验方法构建的TIK-PAFW模型对产品属性关键词的提取有较高的提取准确率、召回率和F1得分,验证了基于PAFW方法的有效性。3.针对传统的基于情感词典进行文本情感分析的复杂过程和建立情感字典的高难度等问题,本文提出基于PAFW的深度学习方法构建加权神经网络模型来对产品评论进行情感偏好分析。首先,设计产品属性情感分析的流程,提出一种特征选择和特征加权(CTI)的权重化模型,构建了CTI-CNN、CTI-LSTM、CTI-Bi-LSTM模型与已有的三种模型在自建的产品语料库进行对比实验,实现产品属性情感偏好分析。然后,通过对比验证实验,得出基于CTI模型在提取准确率上高于传统深度学习模型,多种深度学习模型最低都能达到96.99%的准确率,而改进的CTI-Bi-LSTM模型提取准确率到达98.08%,损失值也收敛到0.0734。最后,说明了本文提出的基于PAFW的深度学习的方法具有较强的产品评论情感分析性能。
其他文献
天线是卫星通信系统的重要组成部分,同时也是导航波与电磁波转换的重要中介,在机载卫星通信系统信号传输过程中起着非常重要的作用。通常情况下一副天线只能跟踪一颗卫星,但在实际工程应用中有时候需要采集多个频段的波长进行组合以满足不同频率的电磁波的需求,因此研究同一副雷达天线下两个不同馈源跟踪两个不同频段KA/KU频段的信号接收与处理,这将成为未来机载卫星跟踪天线的发展趋势。但由于双星跟踪天线运动平台具有特
随着半导体行业的飞速发展,等离子刻蚀技术逐渐成为了制造半导体器件的关键工艺技术之一。然而,含氟等离子体在刻蚀硅晶片的过程中,也会对等离子刻蚀机反应室内部零件产生严重的刻蚀作用,从而导致反应腔室内产生污染颗粒,降低半导体产品的成品率。在服役于等离子体环境中的零部件表面制备一层耐等离子体刻蚀的保护性涂层,能够有效地减缓其受到的刻蚀损伤。YF3涂层是一种面向等离子环境的新型保护性涂层,在含氟等离子环境下
麦克风阵列相较于单麦克风系统,其优势在于能获取关于声场的空时域信息。而声场的空域信息在语音信号处理中,能在减少声源信号失真的条件下,对声源进行降噪、定位、语音增强等声信号处理。而众多声场应用中声源定位在麦克风阵列信号处理中有着重要的基础作用。而各类声源定位算法如何在定位声源的精确度和算法运算量之间找到综合合适或适合某些具体场景的平衡点是声源定位的难点问题。本文的研究目的在于,在实现定位精确度的同时
从分析宝日希勒露天煤矿智能运输安全生产监控系统数据存储及计算存在的主要问题入手,研究并确立了宝日希勒露天煤矿安全生产大数据存储与流式计算的技术架构。采用分布式消息系统Kafka进行数据存储,采用流计算引擎Flink进行数据计算,针对实时数据、历史数据、业务数据的存储需求,分别采用Redis数据库、Elasticsearch、PostgreSQL进行数据存储。通过在宝日希勒露天煤矿智能运安全生产监控
随着手机设计水平的不断提高,各大手机厂商都推出了自己的全面屏系列手机,由于刘海屏、水滴屏等还是存在使用上的缺陷,于是有厂家尝试将手机摄像头隐藏,使用时利用升降马达来驱动的方式来提升屏幕占比,国内外的市场需求量也在不断提升。目前全世界每年生产升降马达在500万只左右,其中国内马达厂家生产总量占全球90%以上。由于该升降马达的运行噪声直接影响了用户使用升降摄像头的体验感,而国内生产厂家对出厂该升降马达
保证通信信息的安全性一直是人们研究的重点,传统的通信加密方式因为量子算法和量子计算机的出现,呈现了不可避免的弊端,所有依靠于RSA、ECC等非对称加密算法的通信网络存在着巨大的安全隐患。在世界上第一个量子密钥分发(Quantum Key Distribution,QKD)协议——BB84协议提出之后,基于QKD的量子保密通信就进入了人们的视野。尽管对于QKD的研究已经发展了近四十年的时间,现有基于
茶文化是中华文化的重要瑰宝,有助于思想政治教育效果的改善。在思政教育中融入茶文化元素,可以激发学生学习思政知识的积极性,同时也是推动思政教育发展的重要手段。为了在思政教育中充分发挥茶文化的重要价值,本文首先分析了思政教育中融入茶文化的重要作用,接着就现如今思政教育中融入茶文化存在的问题进行剖析,最后在此基础上,就思政教育中融入茶文化的方式提出了自己的建议,期望为思政教育提供有价值的参考。
目标跟踪技术是一项应用广泛的技术,在民用及军事领域中都有具体的应用。伴随社会、科技进步,雷达探测环境的电磁特征变得愈加复杂,使得雷达收到较多的杂波干扰。提升杂波环境下的跟踪效果,是改进目标跟踪方法的一个重要方向,具有现实意义。本文针对杂波环境下雷达数据特性进行了分析和研究,重点研究了多假设目标跟踪技术在杂波环境下的应用前景和不足,针对性的提出了一种改进的多假设目标跟踪方法。本文的主要内容包括如下:
现代雷达在进行目标跟踪时,都要经过雷达信号处理、雷达数据处理后才能生成对应目标的航迹。现代雷达跟踪目标数量逐渐增加,再加上杂波的不规则性和雷达组网的趋势,雷达录取器中可能出现大量的点迹数据,给雷达数据处理带来极大的处理载荷,造成雷达跟踪效率下降,跟踪的航迹质量也不高,关于如何在海量数据背景下对大型机和非合作目标的快速跟踪和发现的相关研究,不仅可以解决实际工程问题,还对国防建设有积极促进的意义。本课
笔记本电脑后盖组装作业是将后盖通过螺丝与机体锁紧固定,并在指定位置粘贴展示产品信息的标签。后盖组装的质量对产品品质起到比较关键的作用,影响着产品的外观、零部件固定的可靠性、信息识别顺畅性。目前在某企业后盖组装作业中存在着生产品质不稳定、作业时间长、劳动成本高等问题,制约着该生产线整体良率和生产节拍。伴随着我国经济社会的不断发展,人力成本的不断上升,促使企业不断创新提高自动化制造程度,通过自动化的改