直播网站在线弹幕情感分析

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:stanley45518501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
直播作为一项新兴娱乐模式,越来越受到用户的欢迎。随着直播的发展与普及,大量实时的直播在线评论——弹幕随之产生。这些弹幕不仅与直播的内容相关,而且具有在线实时性、语言简略与互联网化的特征,容易产生一些新的网络流行词汇;同时,用户间的实时交互影响彼此的表达方式和情绪。因此,弹幕一般承载着用户的各种观点,能够及时准确的反映用户在观看直播时的情感状态。对弹幕文本进行情感分析,挖掘出具有价值的情感信息,能够及时准确的掌握用户喜好与行为,对直播网站的精准营销与服务具有重要参考价值。尽管国内外研究者对传统文本的情感分析进行了大量深入的研究,已经有一些较为成熟的成果,但对弹幕情感的研究与分析并不多。而且由于弹幕独特的在线实时、语言简略与互联网化特征,现有方法难以直接用于弹幕的情感分析。为了提高弹幕情感分析的准确性,更好的分析出用户对直播内容的喜好程度,本文对直播弹幕与情感分析相关技术进行了深入的分析。从基于情感词典与基于机器学习两个方面,阐述了文本情感分析技术,并对文本表示方法与文本分类方法进行了综述。针对弹幕语料库缺乏以及语言简略与互联网化特征,构建了弹幕专属情感词典。通过获取虎牙直播网站的后台弹幕文本数据,选取其中的10000条弹幕数据,进行预处理构建了弹幕语料库,并通过优化语料构建了弹幕专属情感词典。然后选取了词向量、情感词、否定词、句法依存关系和标点符号等特征,进行语料特征提取。针对直播弹幕语言的特性,提出了一种基于改进SVM的情感分析模型。通过引入分类处理因子与梯度下降因子,降低了预测器的泛化误差。在此基础上,提出了词向量、情感词、否定词、标点符号和依存句法分析等多种融合特征的方法,将融合结果映射到向量空间上,再通过分类器进行情感分类。通过实验优化调整模型参数,得到了适合直播弹幕的特征组合,提高分类的准确度。实验结果表明,与SVM算法、朴素贝叶斯算法、最大熵算法相比,本文提出的方法在精确率、F1值以及召回率性能上更优。并将情感计算结果生成情感趋势图、根据弹幕热度生成词云,对弹幕文本进行多个角度的可视化分析。
其他文献
芽殖酵母(Saccharomyces cerevisiae)以不对称分裂的方式繁殖,纺锤体定位是保证命运决定因子通过细胞分裂精确分配到子细胞中的关键一环。已知Kar9与Dynein两条通路共同控制有丝分裂纺锤体的定位。Num1是一个在Dynein通路中发挥重要作用的膜蛋白,它为从胞质微管正端卸载到细胞膜上的动力蛋白Dynein提供细胞膜上的锚着点,便于其通过微管产生拉力定位纺锤体。已有不少研究报道
车联网能够全方位提高车辆互联和智能交通运输服务,如道路安全、交通效率和互联网接入等。但是由于车载通信网络的高速动态性,并且无线信道特性会因为道路附近的行人、建筑物、障碍物、以及道路上的车辆等因素构成的复杂交通环境的变化而改变,从而导致无线频谱和功率等资源管理受到较大影响,通信性能也受到很多挑战。因此如何有效的设计车辆到一切(V2X,Vehicle to Everything)通信资源管理至关重要。
多光谱激光雷达可以同时获取被测目标的空间信息和光谱信息,形成多光谱激光雷达点云。这种点云和现有的单色的激光点云相比具有更好的可视化效果、更高的地物识别能力。然而,由于受到扫描设备、探测环境和操作人员的影响,点云中会存在噪声点。为了得到可视化效果更好,精度更高的多光谱激光雷达点云,必须对点云中的噪声进行去除。本文主要以多光谱激光雷达获取的点云为研究对象,开展了去噪研究,主要内容如下:(1)根据多光谱
哮喘是一种以慢性气道炎症和气道高反应性为特征的异质性疾病。患者常出现呼吸困难、发作性胸闷和咳嗽,伴有哮鸣音等症状。全球哮喘的发病率仍呈上升趋势。哮喘给人类健康带来了巨大威胁,是急需解决的医学难题。抑郁症是哮喘常见的共发症之一,研究表明两种疾病之间有一些相同的发病机制,因此,我们猜想治疗抑郁症的药物是否也有改善哮喘的作用。通过前期的筛选以及预实验,我们发现盐酸氯米帕明(Clomipramine HC
自药剂学进入给药系统(DDS)时代,研究者们已经开发出了不同的智能给药系统。与传统药剂学相比,这些智能给药系统在增强治疗效果、降低毒副作用等方面具有很大的优势;同时智能给药系统可以满足个性化医疗的按需给药和按时给药的要求。在智能给药系统研究的过程中,以下两个问题值得思考:(a)靠血液循环的给药系统在毛细血管末端组织或生理屏障部位存在富集或释放慢的问题。或许能构建自振荡给药系统来解决问题。(b)很少
电离层是高层大气在太阳辐射以及各类宇宙射线的影响下发生电离而出现的大气层电离区域。电离层是地球大气的重要组成部分,它对无线电波的传播起着至关重要的作用,能够使无线电波折射、反射、散射等。因此,研究电离层的结构和相关变化特性显得尤为重要。本文基于全球卫星导航观测组织(International GNSS Service,IGS)提供的地基GPS卫星观测数据,对美洲地区(300°E经度附近)不同半球的
随着社会电能应用水平的提高,家庭用电设备种类逐渐增多,居民的用电量剧增,电气火灾事故频发,以至于低压线路中的用电安全和能耗分析倍受关注。故障电弧是引发低压线路下电气火灾的重要原因之一,由于目前我国对串联故障电弧的检测设备并不完善,电气火灾监控系统对居民用电的分析功能欠缺,因此本文将电气火灾监控系统和智能电网中的非侵入式负荷辨识技术相结合,基于低压线路中串联故障电弧的特性和不同家用负荷信息的差异性,
荜茇为胡椒科植物荜茇(Piper longum L.)的干燥近成熟或成熟果穗,又名荜拔、荜拔梨、鼠尾等。荜茇味辛,性热,归胃、大肠经,具有温中散寒,下气止痛之功效,常用来治疗脘腹冷痛,呕吐,胸痹心痛,头痛,牙痛,消化道和生殖系统的炎症等。本论文研究荜茇中的化学成分及其生物活性,为荜茇的进一步研究和开发应用提供科学依据。本论文采用溶剂提取法,正、反相硅胶柱色谱法,葡聚糖凝胶LH-20,半制备高效液相
滇重楼是传统药用植物,野生资源匮乏。人工种植是解决滇重楼药源紧缺的有效途径,但许多人工种植品存在品质下降的问题。利用内生菌保障和改良中药植物品质是当前研究的热点之一。本研究以人工种植的5年生滇重楼为对象,采用Illumina Miseq测序技术和微生物培养技术分别分析根茎、茎和叶3种组织总内生真菌及可培养内生真菌的多样性及菌群特征,以及分析与重楼皂苷含量相关的内生真菌(属);通过与小麦幼苗共培养筛
人脸识别是计算机视觉和人工智能领域最重要的研究方向之一。随着大数据时代的逐步到来,各大媒体数据有了井喷式的增加,人脸识别的需求也在随之增加。传统的人脸识别技术只能解决小规模人脸识别问题,在面对大量人脸图片时的实时性非常低,而且在单机环境下训练效率低下、人脸数据存储困难。因此,如何能够快速、准确的从大量的人脸图像中识别出一个人的信息成为当前人脸识别技术的主要研究方向。为解决以上问题,本文进行以下研究