基于Borderline-Smote算法改进的FastText中文情感极性分析

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xieshanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对单一的FastText模型在不平衡中文语料中的情感极性分析效果不好,以及传统Jieba分词对广领域中文文本适应性不强,数据倾斜导致中文情感极性分析的准确率和召回率产生波动等问题,提出一种基于Borderline-Smote算法改进的FastText中文情感极性分析,通过过采样Borderline-Smote和pkuseg中文分词等预处理方式分别解决分类中数据倾斜、涉及领域广的问题,再与FastText结合进行中文情感极性分析。实验结果表明,该模型在中文情感极性分析中的准确率得到了一定的提高。
其他文献
为了更加准确地揭示恶意程序在异质传感网络中的传播规律,考虑异质传感器节点的移动性,基于扩展经典传染病理论而提出具有不同恶意程序潜伏期的延迟HSEIRD(Heterogeneous Susceptible-Exposed-Infected-Recovered-Dead)模型。计算得出该模型的稳定点,并使用下一代矩阵算法,得到该模型的基本再生数。进行数值模拟,以验证不同恶意程序潜伏期和自由移出率对异质
提出一种基于KL散度的结构化剪枝方法,用KL散度来衡量通道之间的差异性,并定义通道的重要因子,通过删减重要因子较小的通道来进行结构化剪枝。在CIFAR-10和CIFAR-100数据集上,对ResNet进行结构化剪枝,并对比几种较为先进的硬剪枝方法,发现KL散度能发掘出卷积层中的冗余通道,剪枝后精度可能不会下降太多,在减少10%~30%网络参数与浮点运算的情况下,甚至比原始网络准确率要高0.4到0.
基于深度学习的图像超分辨率重建算法不能很好地处理现实生活中有多种复杂噪声干扰的低分辨率图片,提出一种双向的生成对抗网络,引入下采样网络及重建网络联合学习的方法。下采样网络模拟生成现实生活中有复杂噪声及受运动干扰的低分辨率图片,重建网络将模拟生成的低分辨率图片恢复为细节清晰的高分辨率图片。实验结果表明,该算法能够重建出视觉效果良好的超分辨率图像,在Set5、DIV2K等通用测试集上,其客观评价指标(
为了获得利益,在线评论当中有很多伪造的评论,酒店领域的评论也不例外。由于酒店领域的评论只有少部分的标注数据,这给深度学习技术的应用带来了困难。提出一种融合酒店消费领域的专业知识和基于文本卷积神经网络的方法。该方法对数据进行增强,用无监督学习方法获得aspect情感信息,利用卷积神经网络识别虚假评论。实验结果表明,该方法的识别效果比传统方法有显著的提升。
针对云计算在运算过程中资源利用率低以及节点负载不均衡的问题,提出一种改进狮群优化算法的云计算资源调度策略。针对传统狮群算法易早熟收敛陷入局部最优以及算法收敛精度低的问题,通过余弦扰动因子以及双高斯变异函数对算法进行改进。数值仿真实验结果表明,改进后的狮群优化算法较好地平衡了算法的全局勘探能力和局部开发能力,提高了算法的全局收敛精度。建立云计算资源调度数学模型,并通过改进后的狮群算法对模型进行优化。
2017年党的十九大报告指出“中国特色社会主义进入了新时代”,中国经济由高速增长正式转向高质量发展阶段。毋庸置疑的是,深入落实创新驱动发展战略是实现中国经济高质量发展的根本保障。而中国当下面临的现实是,科技发展水平总体不高,科技对经济增长贡献率与发达国家还存在较大差距,国家创新能力不强已经成为中国经济社会发展的“阿喀琉斯之踵”。从区域层面上看,增强区域创新能力是提升国家创新能力和建设创新型国家的必由之路。金融作为现代经济的核心,在改善资源配置效率、降低交易成本、防范和化解风险等方面具有重要作用。技术创新活
针对现有模糊C均值(FCM)聚类算法存在的对初始参数敏感、迭代速度慢,以及对噪声鲁棒性差等问题,提出将蚁群优化算法(ACO)与直觉模糊聚类相结合的方法用于分割脑部MR图像。该算法采用自适应蚁群优化算法获取初始聚类中心与聚类个数作为直觉模糊聚类的初始值,将融入了局部空间信息和犹豫度的直觉模糊聚类算法应用于含噪声脑部图像及脑肿瘤图像进行分割。实验结果表明该算法能够有效抑制噪声干扰且保存图像细节,相较于
以有效市场假说为基础的经典金融学理论认为信息应当及时、准确地在股价中反映。这意味着所有公开可得的信息都能够被理性的投资者充分关注和处理,进而作为投资决策中的一种信号输入,产生无偏的投资行为并最终确定均衡的资产定价;同时,信息活动是资本市场最基本的活动,其支撑着市场的有效运行。然而,行为金融学的有关研究基于认知心理学理论指出,个体的注意力是一种稀缺的认知资源。由于信息成本和个体关注能力的局限,投资者只能选择性地获取并处理有限的资产信息,进而导致投资决策和行为产生偏差。因此,从行为金融视角研究投资者的选择性关
可再生能源的概率预测被广泛认为是电力系统优化的必要条件。提出一种在大量地点进行超短期的参数化风电概率预测的时空方法,其基于logit-normal的参数框架,将多个风电场的位置参数建模为一个向量值时空过程,并采用改进的指数平滑法跟踪尺度参数,采用一种先进的稀疏向量自回归模型拟合技术,对定位参数进行建模,并与传统的向量自回归模型相对比。以澳大利亚22个风电场的每5分钟平均风力发电数据集为例进行了测试
电动汽车的无线充换电通信系统中,信道的开放性带来了安全问题。车辆用户真实身份的隐私保护和非法用户的可追踪性是两个互相矛盾的要求,安全认证技术的复杂度和时延要求也相互制约。围绕这两方面的需求,基于LTE-V2X车联网体系架构,设计一种具备强隐私保护能力的匿名认证机制。该机制同时满足V2X(Vehicle to Everything)通信的隐私性、匿名性、可鉴别、可追踪、完整性保护等多方面安全需求。基