EDA文本增强技术在中英文语料上的差异性分析

来源 :现代计算机 | 被引量 : 0次 | 上传用户：hardstar

【摘要】

：

为了解决中文自然语言处理任务中因语料库数据量较少导致的语言模型欠拟合问题,通过选取中文短文本二分类、短文本多分类长文本多分类等任务,验证英文EDA方法在中文语料上的适用性.通过改变不同的增强操作、增强比例和增强数量等控制方法,进行了增强技术在中英文语料上的应用对比分析,并在Bert模型上进行了扩展验证.实验结果表明该数据增强技术在中文上的应用效果略高于英文.

【作者】

：

靳大尉王雯慧

【机构】

：

陆军工程大学指挥控制工程学院,南京 210000

【出处】

：

现代计算机

【发表日期】

：

2021年27期

【关键词】

：

EDA 文本增强文本分类中英文语料差异性分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

浅谈北京广播电视台演播室视频系统

北京广播电视台4K演播室为本台首个4K超高清和IP化架构的直播演播室,视频系统通过混合架构设计满足大量直播业务的安全播出要求,遵循全台同播技术规范并运用对应的工作流程保证三频道同播的信号质量,通过与播出IP域之间的信号联通为日后全台IP化系统建设做出了有益的实践.

期刊

4K直播演播室混合架构三频道同播视频系统

生成式对抗网络在手写字的性能分析

针对深度卷积神经网络(DCNN,deep convolutional neural network)广泛应用在生成式对抗网络(GAN,generativeadversarial networks)中并取得优异的效果,为了探究不同结构的模型生成的图片质量各异的原因,实验对比GAN、DCGAN、WGAN-GP、Info GAN等模型在手写字数据集(Mnist)的生成模型损失函数、判别模型损失函数以及图

期刊

生成式对抗网络卷积神经网络mnistInfo GAN

“过程→生成”理念下：整式概念的教学设计

基金项目：广东省教育科学"十一五"规划课题：基于三维目标的高师数学过程教学模式研究（2009tjk081）。　　摘要："过程→生成"教学理念认为：教学要向学生展现"有价值有思想有活力的、顺应学生思维与教育规律的、具有整体性连续性生成性的知识生成过程"，基于"过程→生成"教学理念，给出了整式概念的教学设计。　　关键词："过程→生成"教学理念；整式；教学设计　　教学改革最根本的问题是观念问题，如果传

期刊

节目生产管理系统升级改造实施过程及技术创新

中央广播电视总台节目生产管理系统的系统服务器从2011年采购已经持续运行多年,已超过硬件稳定运行生命周期,需要进行全系统的升级改造.本文介绍了系统升级改造的方案选型,实施过程、操作步骤和技术创新,对基于UNIX系统的SAP软件平台的升级改造的实施具有重要参考价值.

期刊

节目生产管理系统升级改造数据克隆UNIX系统SAP平台

基于技术指标和随机森林的股价走势预测算法

由于股票价格波动的复杂性和动态性,预测股价走势多年来一直是研究人员关心的领域.将预测问题视为分类问题,以股票的异同移动平均线、平均趋向、相对强弱、布林线、强力指数五个技术指标和下周股价走势作为随机森林预测模型的特征,然后通过网格搜索优化随机森林模型的参数,构建基于技术指标的GS-RF股价走势预测模型.实验结果表明,相比于技术指标交易策略的收益率,使用GS-RF模型收益率最高、风险最小.

期刊

随机森林技术指标参数优化网格搜索股价预测

增强现实拆装徒手交互系统

现在的增强现实装配辅助系统交互技术大多关注装配工序的呈现,对装配过程中的操作状态关注较少.针对这个问题,提出一个增强现实拆装徒手交互系统.该系统以装配工艺为基础,实现了增强现实环境下的徒手虚拟装配.系统分为硬件层、输入输出层、交互功能层和离线数据层四个层次.阐述层次之间的数据流动,每个层次包括的功能模块,以及每个模块的具体功能.最后,设计了应用案例验证系统的可行性.

期刊

徒手交互增强现实虚拟装配

基于整体一致性的跨平台指标体系构建系统设计与实现

指标体系通常用于评价社会经济体的建设发展水平,随着评估精度和要求的提升,指标体系规模和结构变得越来越复杂,修改单个指标常常引起其他指标的联动,使得更新和修改成本大幅提升.从分析指标体系通用结构入手,综合数据关系和文本语义两类约束提出指标体系“整体一致性”概念,分析系统框架和数据库结构,并对各个功能模块进行详细实现.最终效果表明,使用该系统能持续保证指标体系的整体一致性,并且具备多样化导出功能和跨平台使用能力,极大地降低了构建大规模指标体系的成本.

期刊

指标体系整体一致性Electron框架系统设计软件实现

辩护律师豁免权制度研究

摘要：目前，我国正在进行社会主义法治建设，其目的和宗旨是将社会和个人的行为纳入法治轨道。然而与此相悖的是，近年来，一方面刑事诉讼案件不断上升，另一方面律师刑事辩护率却逐年下降，越来越多的律师选择远离刑事诉讼。究其原因，主要是我国缺乏辩护律师豁免权这一律师应当享有的权利。　　关键词：辩护律师豁免权存在问题完善措施　　一、辩护律师豁免权的内涵　　由于我国并未明确规定辩护律师豁免权制度，因而关于

期刊

“霸王式”执法方式的宪法学探讨

摘要："霸王式"平坟复耕历时长达半年之久，一直成为舆论关注的焦点。一方面在于它违反了中国几千年来的文化传统，但更为重要的是执法手段存在严重的法律问题。"追求正当结果的过程本身如果不合乎正当合理的原则，即便实现正当的结果，也是不可取的。"程序正当是现代法治社会的标志，也是依法行政必须遵守的底线，而依法行政又恰恰是保障人权，维护公民基本权利的途径之一。　　关键词："霸王式"；执法方式；权利　　一、由

期刊

卡通风格人脸图像生成研究

通过风格迁移将卡通化的艺术表现形式施加到人脸图像上,能够获得个性化的卡通风格头像,现已成为计算机视觉的一个新研究方向。当前的风格迁移方法主要使用了生成对抗模型来学习图像的风格模式,虽然能够实现人脸图像的卡通化风格迁移,但容易引入一些瑕疵。在分析生成对抗模型工作原理基础之上,本文设计了使用注意力引导的生成对抗模型,通过注意力模型来引导生成对抗网络中的生成器,帮助其获得图像前景区域,从而降低风格迁移时

期刊

生成对抗网络图像风格迁移图像生成卡通风格

EDA文本增强技术在中英文语料上的差异性分析

与本文相关的学术论文