【摘 要】
:
在语言学中不确定性一般意义上可以被解释为信息的缺乏。通常人们在信息不充分时会采用不确定性的表达,比如在学术论文中发表推论,在网络上发布流言蜚语等。随着大数据时代的
论文部分内容阅读
在语言学中不确定性一般意义上可以被解释为信息的缺乏。通常人们在信息不充分时会采用不确定性的表达,比如在学术论文中发表推论,在网络上发布流言蜚语等。随着大数据时代的到来,由于文本数据的处理需求,不确定性的判断和分类问题的研究备受关注。早期的不确定性研究源于准确地信息抽取,研究人员基于学术论文和维基百科等建设不确定性语料库,并主要采用基于线索词特征的分类方法进行研究。这些研究的不足在于太过依赖线索词特征而普适性不好,也少有深入不确定性具体分类的研究。为了弥补前人研究的不足,我扩充了语料库并设计了不基于线索词的判别算法。基于社交媒体广泛应用的大背景下,我构建了一个中文社交媒体不确定性语料库,我们对这一语料库进行了详细地标注。语料库中不仅标注了句子的不确定性,进一步地不确定性的具体类别也进行了区分。我还设计了一个深度学习模型进行不确定性判断和分类,模型中主要应用循环神经网络理解句子语义,注意力机制被用来抽取重要的不确定性特征,卷积神经网络用来分类。通过与现有方法对比的大量实验,我证明了我设计模型的有效性,其在大部分情况下都能获得最优的结果。总之,本文旨在推动句子不确定性的研究,一方面构建了一个中文网络社交媒体不确定性语料库,另一方面提出了一种新的深度学习模型,这一模型在不确定性判断和分类任务中性能优异。本文的研究成果能对自然语言处理领域有一定的帮助,促进相关问题的研究与发展。
其他文献
旅游资源规划的核心问题,乃在把握住资源的基本文化属性,作出科学的主题定位。岳出南湖本是极富吸引力的优势资源,因为对此认识上的盲目、短视与无知,故其开发利用根本未能达到旅
目的:通过观察芪参益气滴丸对心力衰竭气虚血瘀证患者易损期心功能、因心力衰竭再住院率及死亡率的影响,为中医药在心力衰竭易损期的应用提供依据。方法:本研究为前瞻性随机对照研究,收集2017年6月至2018年10月在辽宁中医药大学附属医院心内科住院治疗后出院的心力衰竭患者66例,出院3天内入组,均符合慢性心力衰竭诊断标准及中医气虚血瘀证辨证标准。将病例依据随机对照分组原则分为观察组和对照组,每组33例。
为了深入认识深部巷道中岩爆的发生机制,研发了配备弹性储能模块的岩爆模拟试验系统对含预制圆形巷道(Φ=50mm)4种岩性模型(175mm×175mm×200mm)进行试验,通过调整初始应力
500kV变电站500kV HGIS、220kV GIS设备由于整体组合长度较大,再加上地质条件复杂多样,已有设备出现漏气现象,对设备安全运行已造成潜在威胁。本文通过实施的一个案例讲述开
<正>本刊讯2月27日,深圳前海微众银行股份有限公司(以下简称"微众银行")与澳门特别行政区设立的澳门科学技术发展基金签署合作协议,双方将在智慧城市、民生服务、政务管理、
SDN(软件定义网络)、NFV(网络功能虚拟化)和云计算技术已成为当前的研究热点。研究如何利用SDN、NFV技术和云计算实现vOLT(虚拟OLT),以解决传统PON(无源光网络)OLT运维难度高、资源发
董其昌将中国山水画从唐代开始划分为南北两派,史称"南北宗"论。贯穿这一派别划分的主要思想是,推崇水墨或加浅绛的山水画,贬低工笔青绿设色山水画;推崇文人画家,贬低工匠和职
本文运用共词分析法,对我国产学研协同创新的研究热点及其演变趋势进行了研究分析。结果表明,我国产学研协同创新研究正处于不断增长的发展阶段,已基本形成理论研究的重要期刊群
在对某工程中基桩进行高应变动力检测抽检时,发现部分嵌岩桩承载力未达到设计要求,通过钻芯法验证发现:部分基桩桩端沉渣过厚,另有部分基桩桩端未达到进入中等风化岩层的设计
本文结合重庆机场空管塔台实际建设情况,利用相关分析软件和工具,通过对重庆机场初选提出的几个塔台位置进行遮蔽分析和仿真,按照科学、客观、公正,保证飞机安全运行和有效提