慕课评论的情感分析算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:kmask
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
慕课(Massive Open Online Course,MOOC,大规模在线开放课程)是基于通信与互联网技术发展起来的一种新型教育模式。其相对于传统线下课程打破了时间和空间的束缚,降低了学习的门槛和成本,有利于教育资源的共享和传播。我国慕课自2013年开始起步,此后一直飞速发展,至2019年,国内慕课无论学习人次和课程数量都位于世界领先水平。然而慕课作为一种新型的教育模式,其建设方式尚处于探索之中,质量仍参差不齐。评论是学习者对慕课教学效果的直接反馈,因此,挖掘评论特征并分析评论情感,可以帮助慕课设计者更好的把握课程建设方向,对提高慕课质量具有重要意义。慕课评论的情感分析属于文本情感分析问题,文本情感分析主要有基于词典,基于机器学习和基于深度学习三种方法。后两种方法由于不需要预先构建人工词典,因此使用更为广泛。其中,SVM(Support Vector Machine,SVM)作为主要的机器学习分类算法之一,具有良好的泛化性和稳定性,在表现上常优于其他算法。然而,SVM的分类效果受惩罚系数C和核参数γ的影响较大,实际使用中一般采用网格搜索即通过一定的步长遍历所有可能参数来确定最优参数,该方法耗时长且精确度较低。因此,本文针对慕课评论情感分析问题,设计了GA(Genetic Algorithm,GA)优化的SVM即GA-SVM算法,主要包括浮点式编码方法、种群分组初始化方法、适应度函数及其验证集、选择函数、交叉变异算子的设计等。同时设计了适应度标定,启发式交叉等控制方法优化算法的收敛性。通过设计GA-SVM算法来提高慕课评论的分类效果。本文从中国大学MOOC平台上爬取慕课评论,对评论进行清洗与中文分词,使用Word2Vec构建词向量模型,同时,对评论进行特征词与主题挖掘。然后对清洗后的评论进行分组,平衡处理与人工筛查,使用已构建的词向量模型结合TF-IDF加权将评论向量化,构建实验样本集。在样本集上,本文首先实验了GA-SVM的验证集切分比,然后分别训练GA-SVM与其他传统分类模型如SVM、NB(Naive Bayesian,NB)、LR(Logistic Regression,LR)等,将所有模型进行比较。最终测得GA-SVM模型在慕课评论情感分类上的准确率、精确率、召回率、F1-score分别为90.26%、92.59%、94.33%、93.45%。实验结果表明GA-SVM总体上优于其他传统分类模型,在慕课评论情感分类上具有较高的准确率、精确率、召回率等,适合处理此类问题。
其他文献
材料一直是人类社会进步与发展的基础,新材料和新应用是我们一直以来追求的目标。区别于尺寸优化和形状优化,拓扑优化有更高的设计性,能够更好的提高材料的性能。但传统的拓扑优化方法是基于各向同性材料和固定载荷发展起来的,对各向异性材料和多载荷问题的讨论比较少。而传统的碳纤维增强树脂基复合材料(CFRP)的设计基于铺层角度、堆叠顺序展开,随着对碳纤维增强树脂基复合材料的性能要求的进一步提高,本文首先对单向铺
随着汽车的保有量逐年上升,道路安全成为了一个重要的问题,每年因交通事故而造成的伤亡损失非常之大,研发新技术来降低因交通事故造成的损失是一件很有社会意义的事情。本文从保护行人的角度出发,研究了基于单目相机的行人检测和人体姿态估计任务,为智能车理解道路中的行人状态提供了算法支持,本文的具体研究内容如下:针对嵌入式系统有限的计算能力,在YOLOv3算法的基础上,本文提出了PRUNE-YOLOv3行人检测
逆变器作为电力装置和用电设备的核心部件,在电力电子技术近七十多年的发展过程中,得到众多学者的广泛关注,然而多数研究工作都是针对工频或者低频的应用。电声换能器、口罩机、超声波清洗设备、材料萃取提纯机、感应加热电器等一系列装备,表明高频逆变器具有广阔的应用前景,因此,研究和突破逆变器在高频、高增益以及宽工作频带等关键技术方面具有重要意义。可控开关电容技术(Switch-Controlled-Capac
分布式电动汽车是纯电动汽车中最具潜力与优势的一类,应用前景十分广泛。而如何保证分布式电动汽车驱动电机故障下的操纵稳定性成为制约分布式电动汽车发展的重要问题之一,也逐渐成为研究热点。为解决驱动电机故障下的操纵稳定性控制难题,本文对四轮分布式电动汽车驱动电机故障下的稳定性包络边界及稳定性控制策略展开了研究,主要研究内容包括:首先,分析四轮分布式电动汽车各部件受力状况,将整车平面运动、轮胎、驱动电机等模
吲哚及其衍生物是许多药物分子、天然产物的重要组成结构单元,因为该结构单元存在于许多具有构建生物制剂或者高效活性分子之中,例如秋水仙碱,康维他汀A-4,色氨酸,吲哚基-3-乙二酰胺D-24851和2-芳基-3-芳基羰基吲哚。开发新颖高效的以吲哚结构单元来构建不同取代的吲哚衍生物是有机合成中非常有趣的课题之一。α-氨基苯乙酮化合物广泛存在于各类药物中间体、载体以及生物化学、医学、药物化学之中,是构建含
随着不可再生能源的不断消耗和环境问题的不断恶化,寻找能够代替的燃料意义重大。天然气作为一种能够胜任替代石油资源的清洁能源,在发动机领域受到越来越多的关注。随着发动机技术的飞速发展和国家排放标准不断提升,缸内气体压力和温度也不断升高,活塞作为燃烧室的一部分,与缸内气体直接接触,其热负荷也不断增加,这要求活塞具有更好的冷却效果。本文以天然气发动机为研究对象,建立燃烧模型和活塞流固耦合模型,对活塞热负荷
随着汽车保有率的不断上升,道路交通事故形势日趋严峻,正面碰撞事故频发,而偏置碰撞的比例大概是它总数的一半。这种具有高发生率的偏置碰撞压溃驾驶舱带来巨大的侵入量给乘员下肢造成了严重的损伤。下肢损伤又是乘员身体永久残疾的主要因素,给个人、家庭和社会带来巨大的影响。目前,全宽碰撞的下肢损伤研究已有一定的发展,但是偏置碰撞的研究并不全面,考虑到驾驶员比其他乘员更容易受到下肢损伤,因此,对偏置碰撞下的驾驶员
锂离子电池目前已经在航空航天、电子器件等领域,尤其是新能源汽车领域,得到了广泛应用。由于其内部的组成结构存在着不稳定性,使电池在工作与储存过程中可能会出现老化、过充过放以及热失控等安全事故,因此,为了避免老化电池的继续使用以及电池的过充过放等带来的安全隐患,准确的预测电池剩余使用寿命(RUL)以及荷电状态(SOC)具有重要的现实意义。本文首先基于电池老化经验模型的粒子滤波及其改进粒子滤波算法对剩余
保证经济增长和充分就业一直是国家宏观经济调控的两大目标,中国经济高速增长的同时创造了大量就业岗位,随着经济增速逐渐放缓,中国社会就业也面愈来愈严重的压力。“十三五”规划中提到,要通过金融体制改革积极发展扶持对就业吸纳能力强的企业和产业,努力创造更多的就业机会。在这样的社会环境下,如何通过企业促进就业发展成为各界关注的重点。在经济全球化不断发展的时代背景下,贸易企业作为中国微观企业主体的重要组成部分
经济增速的飞跃式发展,基本的物质生活已经无法继续满足人民持续增长的需求。对于美好生活的追求,提升幸福感就成为人民在此阶段的新需求。经济社会发展过程中社会生产力发展到一定阶段后所出现的新矛盾,成为了当前我国各级政府公共治理中的重点工作内容。要解决好新阶段社会的主要矛盾,需要为全体公民提供好基本公共服务,保证全体公民都能够享受到基本公共服务,实现全社会均等的目标。对于解决社会经济发展的矛盾,促进社会经