融合词向量和点互信息的领域情感词典构建

来源 :阜阳师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:skykoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感词典技术是文本情感分析的基础。受领域的限制,基础情感词典并不能满足特定领域的情感分析的需要。本文提出一种融合词向量和点互信息的领域情感词典方法,该方法以大量在线评论作为语料库,利用TF-IDF算法挑选领域种子情感词,结合词向量模型提取其与种子词相似度高的词语组成候选情感词集,采用SO-PMI算法来计算各候选词的情感极性,进而融合基础情感词典得到扩充后的领域情感词典。实验表明,构建的领域情感词典能有效提高餐饮领域情感分析任务的性能。
其他文献
为探究血浆热休克蛋白90α(Heat shock protein90α,HSP90α)水平在弥漫大B细胞淋巴瘤患者中的临床价值,了解其是否可作为弥漫大B细胞淋巴瘤患者病情监测和近期疗效判断的肿瘤指标。本研究纳入60例弥漫大B细胞淋巴瘤患者。通过酶联免疫吸附试验检测血浆HSP90α表达,了解其与患者临床病理特征的关系以及治疗前后该指标的变化情况。结果发现弥漫大B细胞淋巴瘤患者血浆HSP90α中位数为86.57ng/ml。HSP90α的水平与Lugano分期、IPI评分、外周血LDH水平、ECOG评分以及结外
阜阳师范大学坚持以习近平新时代中国特色社会主义思想为指导,坚持创新发展理念,优化目标定位,提高服务社会能力,推动市校全方位合作,不断创新“政府出资、企业出题、高校解题”合作模式。自2017年以来,围绕阜阳市的主导产业和新兴产业,学校与阜阳市联合立项建设176个市校合作项目,开展生物医药与食品、新一代信息技术、人工智能、新材料等产业领域新技术的攻关。
实现联合国2030可持续发展目标,减少社会发展不平衡,推动经济可持续发展,减缓气候变化,是一项宏大的工程。要实现这一美好目标,需要众多伙伴(公共部门和私营部门)的合作,需要利用一切可以利用的工具,包括发挥好国际标准和合格评定的重要作用。
本研究采用便利抽样,运用“问卷星”平台在线调查了安徽省1282个养老机构管理者新型冠状病毒感染肺炎防控知识和养老机构现存困难。调查结果显示养老机构管理者新型冠状病毒感染肺炎防控知识得分为(147.462±15.270)分;防控知识高水平和低水平分别为1179人和103人,百分比为92.0%和8.0%。防控知识得分和防控知识水平受多种因素影响。总体来说养老机构管理者新型冠状病毒感染肺炎防控知识水平较高,但仍存在提升的空间;养老机构现存的困难和不足也比较明显,应引起相关部门和养老机构管理者的重视。
通过应用新教法提高大学体育健身瑜伽选项课教学质量。在大学体育健身瑜伽选项课中实行了MOOC翻转课堂教学改革实验,与实施传统教学模式的基础班进行比较。运用MOOC翻转课堂的班级在对学习兴趣,评教分数和教学模式方面学生的评分显著较高,学生的瑜伽理论以及瑜伽体位技能测试成绩也显著高于传统教学模式班级。MOOC翻转课堂教学模式适用于高校的瑜伽选项课教学,有利于提高学生的学习主动性,提高学生的理论和技术水平,促进学生终身体育发展。
针对节点之间的相似性是社交网络研究中的一个核心概念,提出了一种因邻居节点状态变化引起的节点相似.度变化的算法称为动态相似度算法(TCS,Time Cosine Similarity)。首先,定义变化指数(TE,Time Exponent)来计算出节点状态变化中由邻居节点所带来的影响。其次,考虑节点和邻居节点的总体变化定义节点变化指数(TS,Time Similarity)。最后,在余弦相似度的基础.上提出了一个称为动态节点相似度的量来表示节点之间的相似程度。多个数据集实验结果显示:所提出的方法的划分效果优
根据2010-2018沪深A股.上市公司数据,以信息传递理论与委托代理理论为基础,通过实证分析研究环境不确定性对企业投资效率的影响。研究发现,环境不确定性会导致非效率投资,既可以表现为加剧过度投资也可以表现为加.剧投资不足。进一步研究发现真实盈余管理加剧过度投资,对投资不足没有明显影响,并且通过中介效应检验证明:真实盈余管理在环境不确定性与过度投资中起到中介传导作用。
针对移动机器人在室内环境下的定位问题,本文采用基于GFCC((Gammatone Frequency Cepstrum Coeffi-cient))特征提取BatSLAM模型,用指数压缩来模拟听觉系统的非线性特性,使用加海宁窗处理来减小回波信号所存在的边缘影响,使用离散余弦变换来对耳蜗图进行有损数据压缩,从而提高耳蜗图的抗干扰能力,使用升半正弦倒谱提升来提高耳蜗图的鲁棒性,通过GFCC特征提取可以有效提高室内定位的精度和准确性。实验表明,基于GFCC特征提取Bat-SLAM模型,通过提高耳蜗图的抗干扰性和
张丙开,男,博士,教授,硕士生导师,安徽省物理学会常务理事、中国天文学会会员、安徽省天文学会理事。2008年毕业于中国科学院高能物理研究所,现就职于阜阳师范大学科研处和物理与电子工程学院。主要致力于粒子天体物理方面的研究,具体开展高能环境下电磁波产生和传播、活动星系核光变、高能宇宙线粒子起源、光电转换探测器标定、数据分析处理等方面的研究,同时从事科研管理及相关研究工作。
针对目前中文命名实体识别无法表征一词多义以及未能深入捕捉文本潜在语义特征的问题,提出一种融合注意力机制的BERT-BiLSTM-CRF中文命名实体识别方法。首先,通过BERT模型预训练,获得含有丰富语义的词向量;其次,传送到BiLSTM中,获取文本的上下文特征;然后,将上层的输出结果再传向注意力层,对文本中不同文字赋予不同的权重,增强当前信息和上下文信息之间潜在的语义相关性,捕捉文本的潜在语义特征;最后,将结果输入到条件随机场进行解码标注。实验结果表明,在1998年人民日报数据集上取得了较好的识别效果。