基于深度学习与统计信息的领域术语抽取方法研究

来源 :数据与计算发展前沿 | 被引量 : 0次 | 上传用户:bhwbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[背景]及时掌握领域术语有助于动态把握领域发展方向,揭示领域的核心知识与研究热点.[目的]为提高领域术语抽取准确率,提出一种基于深度学习和统计信息的领域术语抽取方法.[方法]首先,对领域中文专利文本进行字嵌入表示,基于B E RT(Bidirectional Encoder Representations from Transformers)获取字符级的向量表征作为模型的输入;然后,利用BiLSTM-CRF(Bidirectional Long Short Term Memory-Conditional Random Field)深度学习模型提取序列化文本的语义特征,得到领域术语标注序列;最后,综合计算复合结构术语的互信息和左右熵,并结合领域知识库对抽取结果进行校正.[结果]模型在“盐湖提锂”领域进行实验,结果表明BERT-BiLSTM-CRF模型抽取该领域术语准确率达到77.33%,而对抽取结果进行校正进一步将准确率提升了3.68%,是一种有效的领域术语抽取方法.
其他文献
本研究通过随机问卷调查法,全面调研了湘西北地区石门县罗坪乡的垃圾产生特性和分类处理现状,结果表明,该乡村民生活垃圾具有人均产生量低、厨余垃圾占比偏高和可回收垃圾占比低等特性.考虑该地区的实际情况,提出了村级宣传引导、屋场培训、激励约束的村民生活垃圾综合治理模式,因地制宜地建立农户和村庄垃圾收运体系,屋场监管和村级主导的设施维护机制.
业界众所周知,新一代人工智能技术以深度学习为代表,而深度学习的开发离不开深度学习框架的支持.目前的深度学习开源框架百花齐放,有数十种之多,从早期的caffe、theano到主流的TensorFlow、PyTorch、MXNet等,越来越多的科技巨头公司加入到机器学习框架的研发中,国内也有百度的PaddlePaddle、华为的MindSpore等.但得益于良好的开发生态和早期的布局,目前在产业界和学术界占据主导地位的仍是谷歌的TensorFlow与Facebook的PyTorch这两大开源框架.
期刊
[目的]介绍了基于可编程网络的UPF边缘调度机制,在开源网络操作系统中实现了网元功能和UPF网元统一调度.该方式旨在实现UPF网元下沉到边缘开放网络设备上,形成UPF网元在边缘场景下和可编程网络融合.现有的网络设备大多数只提供有限的网络接入方式和网络功能,面向边缘场景多样性需求,现有的网络接入和资源调度方式难以满足场景需求.[方法]从目前主流的开源网络操作系统SONiC出发,基于容器技术实现网络功能的编排调度能力以及UPF的集成方法,阐述了以云原生方式来实现SONiC和UPF融合资源调度方案.[结果]基于
针对现有单井产液量预测方法的局限性,从地质、压裂、开发等3个方面考虑,选取影响单井产量的12种影响因素,采用相关向量机(RVM)对多因素影响下的单井产量数据进行回归,并利用增强鲸鱼算法(IWOA)对RVM模型进行优化,建立IWOA-RVM的单井产量预测模型.在低渗透油田进行了实例分析和模型对比,结果表明,IWOA-RVM模型可以处理各影响因素之间的非线性、非正态关系,与BP、IWOA-ELM和SVM模型相比,其RMSE最小,MAPE最小,训练时间最短.该模型在预测低渗透油田油井产量上具有一定的科学性和有效
[目的]目前,TensorFlow这一主流机器学习框架与CUDA异构编程环境的组合在学术界与工业界得到大量使用,使用CUDA实现的TensorFlow算子是加速计算的关键.然而,TensorFlow对于OpenCL这一开放通用的异构编程标准的不支持严重限制了TensorFlow的通用性,并导致OpenCL硬件设备的算力无法充分发挥.[方法]针对此问题,本文深入探索TensorFlow的底层实现,在对TensorFlow代码结构深入分析的基础上实现了OpenCL算子,并且在2.2.0版本的TensorFlo
惩罚性赔偿制度在我国的消费者保护、产品质量和知识产权等领域均已适用多年,自民法典第一千二百三十二条的规定公布后,惩罚性赔偿现已扩展到环境侵权责任领域.在法律规定没有明确说明的前提下,学界对环境责任领域惩罚性赔偿的权利归属主体存在争议.从惩罚性赔偿的价值构造和适用条件来看,惩罚性赔偿正是为弥补私益救济的不足而提出的,适用于私益诉讼有其合理性和正当性,而环境公益诉讼适用惩罚性赔偿也并不存在根本性的原则问题,更多的是一些制度设计上的不兼容.因此,惩罚性赔偿的权利归属主体与请求权主体一致,既包括普通公民,也包括国
为缓解“弃风、弃光”现象带来的不利影响,探寻风光-氢耦合系统的经济性,对三种不同发电方式进行经济效益分析.运用全寿命周期法,采用LCOE、NPV、EIRR法对系统成本、非系统成本进行分析,构建成本-效益模型,比较单一风电、单一光伏发电以及风光-氢耦合系统方式下的经济和环境效益.结果表明,风光-氢耦合系统相较于单一风电和光伏发电系统,更有利于提高发电站的经济效益,降低碳排放量,为今后风光-氢耦合系统在提高发电站经济、环境效益、氢能利用等方面提供参考.
[目的]为了解决科研云联邦构筑过程中因科研机构归属不一带来的资源难以计量和数据异步问题,本文提出了科研云联邦计量系统.[背景]考虑到集中式资源计量可能导致运营成本高、效率低、恶意攻击、数据存储不安全等问题.[方法]本文根据科研云联邦的特点,结合联盟链的技术特点,设计了基于联盟链框架Hyperledger Fabric的科研云联邦计量系统.[结果]该系统保证联邦参与者之间的计量互信,确保资源计量准确无误地同时保护用户数据隐私,帮助各科研机构管理员检查可用资源,提高管理员工作效率.
制定黄河法事关黄河流域生态保护与高质量发展战略的落实,也是我国生态文明建设的重要组成部分.我国制定黄河法有其现实意义,但同样也面临理论与现实困境.因此,在应然层面需要明确黄河法的立法目的、法律特征、法律位阶和法律客体等内容;在实然层面借鉴已制定的《长江保护法》,通过总则、具体制度和附则章节详细规定与黄河有关的事务,对立法目标、适用范围、流域范围、基本原则、生态保护、绿色发展、责任与救济内容进行明确规定,让黄河法成为一部名副其实的流域保护法.
[目的]智能时代背景下物流需求的运输成本精准预测对于资源调度及管理起着关键作用,本研究是为了丰富当前解决运输问题的方法,简化NP-hard问题的局限性.[方法]针对企业平衡运输成本问题,归纳了当前运输问题分类,以运输总成本最小化为目标,采用了传统运输问题的平衡数学模型,并运用了国外最新智能优化算法——海鸥优化算法来求解,通过迁移、攻击寻找目标函数的最优解.[结果]仿真实验结果证明了海鸥优化算法与传统管理运筹学方法、量子粒子群算法、遗传算法的求解结果相吻合.[局限]海鸥优化算法是新兴元启发式算法,仍在不断发