自杀意念原因抽取中的标签增强方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:wqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自杀已成为全球重大的公共卫生和社会关注问题,自动在有自杀意念的社交文本中抽取出该意念产生的原因,可以为自杀预防提供支持。在自杀意念原因抽取任务中,由于人工标注的主观因素造成标注边界模糊或存在误差,同时人工标注成本大也导致训练样本量较小。本文针对这些问题探索和使用数据增强的方法,提出基于标签窗口缩放的标签增强方法LWS,LWS通过设计标签窗口缩放概率、缩放尺度、标签增强率等参数及其应遵循的原则,较好地解决了原训练集中人工标注较短和存在误差的问题,F1值比原训练集上的Char-BiLSTM-CRF模型平均提高了1.6%。实现了基于同义词替换SR、随机插入RI、随机交换RS和随机删除RD的EDA数据增强方法。实验结果表明,在基于EDA的数据增强中,单独和综合运用SR、RD都取得较好的效果,F1值比原训练集上的Char-BiLSTM-CRF模型平均提高了1.1%-1.6%。此外,当数据改变较少时,即增强率或改变率较小时,模型提升效果较明显,而过度增强反而会降低模型的性能。
其他文献
在现阶段中美“芯片战争”的时代背景下,对于我国的CMOS图像传感器厂商来说,当前正处于一个挑战与机遇并存的时代。锁相环(Phase Locked Loop,PLL)是图像传感器中必不可少的重要组成部分,PLL作为片内的时钟生成器,为CMOS图像传感器提供稳定的时钟信号,从而保证CMOS图像传感器的正常工作。通常采用的时钟生成器是传统的模拟电荷泵锁相环(Charge Pump Phase Locke
软体机器人具有良好的形态适应性,已成为涉及材料、机械、力学等多学科交叉的前沿领域。软体变形材料是软体机器人开发的材料基础,然而受一般软材料固有低模量属性的限制,目前的软体机器人普遍存在难以维稳、负载能力差等缺点。现有的解决方案是采用气动驱动器来赋予软体机器人以变刚度功能,但存在系统复杂、响应慢等问题。若能直接通过电场调控软体材料的弹性模量,开发出电驱动的变形-变刚度一体化智能材料,则有望解决制约软
基于纳米裂纹的传感器具有较高的灵敏度,在生理信号采集、人机交互等领域具有广阔的应用前景。纳米裂纹传感器的性能受到了纳米裂纹图案的影响,实现纳米裂纹的精准、可控分布,具有重要的科学意义和实际应用价值。为此,研究者们提出了多种纳米裂纹图案化的方法,如缺陷引导法、薄膜辅助法、曲率控制法、光刻辅助法等。然而,这些纳米裂纹图案化的方法,使用的基底材料大多为聚二甲基硅氧烷(polydimethylsiloxa
近年来科技的飞速发展对高性能合金的快速开发提出了更高的要求,传统的合金设计方法开发周期长,开发成本高,难以满足社会需求。随着计算机技术的不断发展,机器学习方法被成功应用于各个领域。本文将以钛合金为载体,在材料学科小数据集的基础上,将合金体系关键特征参数与机器学习方法相结合,成功构建高性能合金的设计及工艺优化方案。本文利用XGBoost算法,结合钛合金体系内特征函数和遗传算法,构建了团簇式嵌入的机器
智能移动机器人是新一代人工智能的重要研究领域,在工厂、医疗和物流等多个领域的需求与日俱增,疫情期间大量智能移动机器人奔赴战疫前线,在药品配送、病房消毒、安防巡逻和安检测温等方面与医护人员并肩作战,发挥了重要作用。在移动机器人关键技术中,稳定、高效及准确的定位是实现自主性的核心,而实际环境复杂多样,运动过程位置易丢失,且单一传感器有各自局限性,利用多种传感器的优点,提高定位能力将推动移动机器人的实际
线控转向(Steering-by-Wire,SBW)是汽车转向系统的未来发展方向,随着汽车电子化的快速发展,越来越多的研究人员投身于线控转向的相关技术研究中。线控转向相较于传统转向系统有诸多优势:去除转向柱,避免事故中对驾驶员的伤害;路感可调,改善恶劣路况下的驾驶员体验;节能环保,摒弃液压助力造成的污染;可拓展性强,为未来无人驾驶的发展做好兼容接口。线控转向的关键技术主要掌握在国外公司手中,国内对
本文将传统的马科维茨模型进行了改进,引入了风险厌恶因子,对投资比例设定了上下限。同时提出了一种并行遗传算法(PGA),其运算时间短,而且随机搜索,不易陷于局部最优。将该算法引入证券投资组合领域,将数据随机分为若干个小组,同时进行遗传优化,提高了运算效率。通过实证分析,求解改进的模型,计算表明并行遗传算法能够准确快速地解决证券投资组合优化问题。
软体机器人是本体、驱动、感知高度集成的新型机电一体化智能系统,具有良好的连续变形能力、运动灵活性、友好交互性及生物相容性等优点。多功能高度集成使得软体机器人制造技术成为当前的研究热点之一,本文围绕磁致变刚度软体驱动器,开展了基于直接墨水书写原理的3D打印技术研究。具体研究内容如下所述:(1)在软体驱动器磁致变刚度特性分析的基础上,研究了刚度变化幅值最大化的材料选型。首先,设计了磁致变刚度软体驱动器
随着国内以及一带一路沿线国家地下工程、隧道工程以及引水工程等基础设施建设的不断发力,全断面岩石掘进机凭借着其掘进效率高、安全性能好以及施工成本低等优点,被广泛应用于各种隧道建设中。TBM在掘进过程中主要依靠刀盘上的滚刀进行破岩,在与岩土的强烈作用下,滚刀极易磨损失效。失效的滚刀需要及时更换以保证TBM的正常掘进,然而目前TBM失效滚刀的更换几乎全部依赖人工,人工更换会带来一系列的负面问题,包括施工
氧气是人类赖以生存的气体,空气中的氧气含量过高或者过低都会对人体健康造成影响,通过检测呼出气体中氧气含量能够判断人体的健康状况。随着气体传感器的发展,其在便携式设备上集成的需求也在不断增加。目前,商用氧气传感器普遍采用电化学传感器,但它具有不易集成、功耗高、稳定性差的缺点。相比之下,半导体氧气传感器因其可集成、体积小的优势而被广泛研究,但是目前大多研究是面向真空或者惰性气体氛围的使用环境,而且需要