面向论坛文本的大学生情绪识别研究

来源 :华中师范大学 | 被引量 : 6次 | 上传用户:long12312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大学生的心理健康是当今社会重点关注的问题。由于所处年龄段、生活空间、文化层面的特殊性,大学生情绪比较敏感,容易产生孤独、压抑或自卑等负性情绪,这不仅会影响自己的学习和生活,还容易传染给周围的人,而长期处于负性情绪状态可能导致严重后果。因此,负性情绪分析和个体识别对于增进大学生心理健康、预防和治疗问题行为等都具有重要意义。由于情绪自身的复杂性,长久以来,个体情绪测量主要依赖于心理学量表测评,这种方式需要对被试进行干预,而且被试群体的文化层次和敏感性因素也会在一定程度上影响测量的效果。文本情绪分析技术为情绪的测量提供了一种新的途径,它可以不加干预地对个体情绪进行分析和跟踪,增强研究结论的生态效度,具有良好的发展前景。本文采用基于机器学习的方法对大学生论坛文本内容进行情绪分析,并对大学生负性情绪个体展开识别研究,为后续的心理干预和辅导提供参考。该研究主要面临着两方面的困难:一方面,论坛文本具有长度偏短、话题宽泛而且表达不规范等特点,不利于情绪特征的选择和提取;另一方面,由于情绪文本数量巨大且各类别数量不均衡,严重影响情绪分类的识别准确性。因此,亟需提出一种有效的方案来解决特征选择、特征稀疏性以及情绪类别文本数量不平衡的问题,以提高识别性能。鉴于此,本文的研究工作和创新点主要包含以下三个方面:(1)针对论坛情绪文本特征稀疏性的问题,提出了一种基于多类别特征组合的特征集构建方法。该方法在对论坛文本的特征进行深入分析后,综合词语特征、组合N-gram特征、共现词语特征和词簇特征构建论坛文本情绪分类的特征集。不同类别的特征可以获取文本多个方面和不同程度的情绪线索,综合这些线索可以更加准确地表示文本所包含的情绪。首先在构建词语和组合N-gram两类应用最为广泛的特征基础上,针对传统的特征选择方法关注特征与类别的贡献关系而忽略了特征之间的联系的问题,引入表示词语特征之间共现关系的共现词语特征;针对文本长度较短可能引起的零特征问题,引入基于词向量聚类生成的词簇特征。继而利用特征选择算法对各类别特征进行评估,选择具有良好分类能力的特征构建特征集,并定义冗余规则去除组合过程中带来的特征冗余。将多类别特征组合的特征集构建方法应用于论坛文本的正负性情绪分类,实验结果表明该方法能有效提高分类的识别效果。(2)针对多类别情绪分类中某些情绪类别数量较小的问题,提出一种基于样本中心点距离欠采样的策略选择的子空间分类算法(Strategic Dynamic Subspace and Distance Based Under Sampling Method,SDS&DBUSM).该算法基于随机子空间(RSM)算法,主要在两个方面进行改进:一方面针对RSM在生成子空间时,采用完全随机采样可能导致子空间质量不高的问题,提出利用策略选择特征的方法提升子空间质量。通过权重算法计算各特征识别能力,再根据识别能力策略选择良好识别能力的特征,同时保证子空间的差异性和高质量,整体提升集成学习的效果。另一方面考虑到情绪类别帖子不均衡性问题,采用基于样本中心点距离的欠采样的方法,去除子空间中噪声样本和冗余样本,有效地提高了对少数类别的识别效果。实验证明,SDS&DBUSM比单分类器算法和传统RSM算法获得更好的性能。(3)针对基于文本情绪研究如何进行个体情绪测量方面的研究不足,提出一种基于论坛文本情绪分类的个体情绪测量的方法。该方法根据大学生用户在论坛中的行为表现,综合多种情绪因子的方式来对个体的情绪进行测量。除了考虑用户在论坛中发布的帖子情绪类别之外,还考虑用户的登陆情况、帖子统计情况、帖子用词情况等多种情绪表达因子,综合计算个体情绪值,进一步根据情绪值划分个体情绪类别。与基于心理学量表的方法相比,这种方法可以提高个体情绪测量效率,动态跟踪被试的情绪变化,为后续心理辅导提供参考和支持。
其他文献
自20世纪80年代以来,我国高中阶段教育一直保持着普、职双轨并行的发展格局。随着经济的发展、产业结构的调整以及高中教育重心的逐步下移,打破普职壁垒、实现普职融通将成为
长周期观察活动能够提高小学生的科学素养。文章分析了当前课外长周期观察活动难以实施的主要原因,探讨了提高学生课外长周期观察活动效果的策略,即:改进教学设计,激发学生长
为了在农业种植中保证种植质量和经济效益,就需要保证种植的特性和质量,但在当前我国种子检验工作中,还存在一些问题,影响着种子的质量。基于此,针对我国种子检验工作现状、
<正>草莓的主要病害有褐色轮斑病、叶枯病、叶斑病、白粉病和灰霉病等;主要虫害有叶螨、蚜虫、地老虎等。基于此,简述草莓病虫害无公害防治技术,以期达到丰产、优质、低成本
提出在小学生认知科学教育初期,重视观察活动不但能够促进学生认知从感性上升到理性,而且可以为学生学好各门课程打下良好的基础。通过科技课程实践中的观察活动做出了分析与
随着社会经济的发展,水果市场逐渐扩大,种植技术也得到很大的改进,无公害苹果的种植也不例外。为了提高无公害苹果的质量,在苹果树种植过程中,种植人员需要对苹果树进行综合
英国高中阶段教育普职融通的有效推进,很大程度上得益于其相对成熟的学校课程体系和教育证书体系:一方面,通过综合高中同时开设普/职两套课程体系、职业高中大力开设普通教育
<正>神经系统裂头蚴病临床罕见,是曼氏迭宫绦虫中蚴期幼虫—裂头蚴感染引起。2003年10月至2014年12月收治2例此类病人,现报道如下。1病例资料病例1:女,32岁,因右下肢麻木疼痛
目的分析门诊泌尿系统患者尿培养标本污染原因,评价不同尿培养标本留取方式的应用价值。方法将门诊泌尿系统患者300例随机分为3组,第1组采用水洗消毒法、第2组采用纸巾消毒法
随着计算机网络技术的不断发展,服装电子营销模式以其独特的优势不断刷新着服装零售的交易额。年轻族群在享受服装电子营销带来便利的同时,也承受着很大的困惑。基于此,本文