语料库构建相关论文
中国科技典籍作为中华典籍与世界典籍的重要组成部分,不仅是中国科技文明与发展的载体,也为中国同世界的科技文化交流做出了重要贡献......
口令是当今互联网主要的身份认证方式,对用户的隐私起十分重要的保护作用。本文从用户口令词汇的规律性入手,重点研究口令词汇的特......
跨文化能力作为外语教学培养的高阶目标,引领教学设计不断革新.精读课程作为英语专业的核心课程,其教学改革和任务设计对语言能力,......
随着国家少数民族工作治理理念的调整变化,少数民族地区推广普及国家通用语言的工作,显得尤为重要,让藏族学生潜移默化地、自觉自......
随着经济全球化的快速发展,国际贸易中对商务英语的质量提出更高要求.为解决传统语料库构建方法在实际应用中存在的信息更新时间长......
从大量军事文本中快速、准确地获取需要的有效数据信息,并转化为人和机器能够共同理解与使用的结构化形式,是当前军事信息处理领域......
中医理论知识体系结构庞大,实体和实体间关系错综复杂,需采用合适的技术手段对该领域知识加以组织和存储,以便能灵活地运用到日常......
学位
提出一种基于语境相似度的中文分词一致性检验方法.首先利用词法和句法层面的特征,设计基于构词、词性和依存句法的分类规则,再使......
当前心血管疾病已经成为导致居民死亡的最主要原因,包括Framinham心脏研究在内的多项研究表明,心血管疾病与风险因素密切相关。我......
近年来,随着信息技术的不断发展,自然语言处理的研究逐渐转向自然语言理解的研究,机器阅读理解便在这个大背景下应运而生。机器阅......
医学英语是ESP的一个重要分支,但迄今为止尚未见到较大规模的医学英语语料库建设。本文介绍了医学著作英汉平行语料库的构建工作,......
随着互联网的迅速发展以及移动智能终端的普及,越来越多的用户在以微博为代表的社交网络上表达自己的观点和情感,由此产生了大量富......
互联网技术飞速发展的今天,网络空间所包含的大量文本数据中既蕴含着智慧的结晶,又存在着潜在的风险。在此背景下,基于自然语言处......
近年来,随着生物医学实验方法的变革,相关实验数据和文献资料呈现指数级的增长,如何从规模庞大的科学文献数据中快速有效地抽取出......
近年来,流式文档广泛地应用在社交、媒体、办公以及出版等领域。面对海量的流式文档,如何使计算机自动、准确地理解文档成为了各行......
让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向。语音合成在导航、通信等领域都有广泛运用。目前,文语转换依旧是语......
缅甸语是缅甸的官方语言,属汉藏语系藏缅甸语族缅甸语支,与同语系的汉语和藏语语音合成研究相比,缅甸语语音合成相关研究亟待重视......
在自然语言中,事件是一个基本的语义单位,是构成文档的基本要素。事件可信度描述了该事件是确定、否定或者是不确定等情况,表达了......
近年来,随着国家及民众环保意识的增强和强有力环保举措的实施,我国的大气质量状况也日益改善,但公众对于美好生活环境的要求也越......
随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑......
为了满足法语学习者的语言训练需求,提出基于计算机的法语语料库构建及其语言评估这一思路,在计算机技术上引入降噪处理技术、提取......
描述了利用电话录音的汉维平行语料库构建了一个基于短语的统计机器翻译系统。我们对词级的语料库进行了切分,得到了词素级的语料......
本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题:制定标注规范、选择标注集、设计标注工具......
知识服务逐步成为地理信息系统新的价值目标。建立地理实体间丰富的语义关联,是保障知识流动和服务精准的关键技术之一。文本是知识......
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率.N-gram统计语言模型是目前广泛使用的语言模型......
语料库是英语教学的基础,完整的、系统的语料库能够提升学生英语词汇学习效率,丰富学生英语词汇量,本文主要探究语料库在高校英语......
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。......
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据......
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型......
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克......
针对中文零指代问题,从篇章视角进行理论分析,并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus,CDZC)的构建工作。首先......
运用语料库语言学的基本观点,探讨了陕北民歌语料库构建原则及WEB管理系统的设计实现,研制了陕北民歌ACCESS语料数据库,其中包含全......
京津冀地区是我国北方经济发展的一块腹地。加大对该地区的经济开发,推进多样化的经济形式向外延展是河北省现阶段的重大战略。当......
提高红色旅游英译水平,扩大海外旅游市场至关重要。为此,研究对红色旅游及其英译现状作了概述和评论,包括国外和国内的研究,前者涉......
双语语料库在机器翻译研究中的作用已日趋明显,但作为一项重要的语言资源,双语平行语料库的系统性构建在中国国内尚未得到充分的关......
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型......
利用BRAT标注工具及人工标注方法,根据初步制定的文本语料标注规范,按照语料选择、语料预处理、语料标注、标注校对、一致性检验的......
该文针对目前翻译教学模式单一,学生翻译学习主动性不强等问题,提出语料库辅助翻译教学的构想,介绍自主建立语料库方法,建库常见问......
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨......
本文就构建教学型国学翻译汉英语料库过程中遇到的语料库大小、语料采集和语料库构建细节问题进行了讨论,旨在推动构建教学型国学......
为了促进英语科技文献的汉译研究和科技英语翻译教学研究,我们构建了较大规模的"科技文献英汉翻译平行语料库"。通过选择9本科技英......
在经济全球化趋势的影响之下,近年来我国高校商务英语教学工作不断向前推进,为复合型人才的培养做出了突出的贡献,为推动我国经济......
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不......
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分......
文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点......