民文语料库建设工具软件的研究

来源 :第十一届中国人工智能学术年会 | 被引量 : 0次 | 上传用户:freecase
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在民文语料库建设过程中,从基础语料库的建设到依据标准规定进行语料库多层次语言信息的标注,都需要计算机软件工具来辅助进行.本文就此展开讨论,内容涉及民文语料库建设过程中语料的采集、编码、存储和标注.论文工作为深入研究民文语料库工具软件的开发奠定了坚实的基础.
其他文献
本文在研究分析城市深基坑支护工程众多因素的关系和特性的基础上,提出一个用于深基坑支护工程优化设计的协同演化算法.该算法提供了方案设计空间和细部设计空间不断演化的协同机制,实现了基坑支护方案与细部结构的协同优化设计.
本文研究用于心理动力机制的移动机器人平台.本实验中"Neko",是一个基于视觉和触觉传感器以及必要硬件装置,能完成指定任务的机器人.除了仿真机器人之外,本文还讨论如何从心理学角度模拟意识.实验利用软件实现了移动机器人的智能控制系统,研究了机器人的情感,证明了心理动力机制.
解决水电站中长期风险调度问题,在电力市场环境下,显得尤为必要.在纵观国内外水电站中长期风险调度问题研究现状的基础上,应用集对分析理论对市场环境下水电站中长期调度的风险问题进行具体的分析,对径流、发电用水和电价进行了同异反描述,建立了基于集对分析的中长期风险调度模型,并用一次二阶矩法进行求解,可提供效益与风险的定量关系.
随着科技的迅猛发展,尤其是现代通信与传媒技术的不断进步,人们可以轻而易举地获得大量信息。但问题也随之而来:噪声夹杂其中,使得信息多且杂,难以筛选。此外,人们先要将噪声删除,其次还要在海量信息中确定信息的重要性以及自己对某类信息的依赖程度,这无疑又是难上加难的。本文讨论了用集对分析方法分析、筛选复杂信息系统中的复杂信息,并给出程序框图及应用实例.
本文基于多智能体理论,提出一种采用模糊认知图模型,通过网格节点对任务分配决策支持度进行协商,来实现资源配置的智能网格调度策略.该调度策略无需存在处于上层的资源调度决策单元,各网格节点利用由任务分配而形成的关联作用,通过协商即可实现对资源的调度.该调度策略适用于分布式计算,并支持网格节点的动态变化,具有较好的实时性和鲁棒性.
将南水北调东线工程看成是由蓄水湖泊存储Agent、抽水泵站执行Agent、输水通航河道传输Agent等组成的复杂系统,本文提出基于供应链管理的南水北调东线多Agent调水仿真模型,研究和设计了该仿真模型下多Agent之间的交互协议.详细分析了仿真模型中各Agent交互过程,以及得出和制定的水资源调度计划的可行性和合理性.
风险基础审计是以审计风险的分析和控制为基础,因此审计风险管理在整个审计过程中占据了极为重要的地位.把基于案例的推理方法(CBR)引入审计风险管理中,有利于审计人员的经验传承,提高审计风险管理的质量.
作为计算机进行中文处理的基础和关键,词语粗分必须能提供少量甚至唯一的高准确度的词语切分结果.本文在引入了词语频率数据的扩展中文词典基础上,结合逆向最短路径、全切分和基于统计概率分词方法,对原有的计算模型进行了改进,实现了一种结合逆向最短路径和统计模型的中文词语粗切分方法.对大规模语料库的实验表明,在返回唯一结果时,该方法的切分正确率达到了99.73%,比以前最好切分方法的正确率提高了6%多,证明该
知识已经成为推动经济发展的主要力量.KMSphere是中科院计算所开发的基于本体的知识管理平台,本文在介绍当前本体开发领域研究现状的基础上,分析对比目前工作的不足,主要针对半自动化本体的创建问题展开讨论,从本体工程角度给出了半自动化本体获取的过程.
随着IT技术的迅猛发展,移动通讯技术渐渐融入驾驶界面的设计之中.信息交流,尤其是言语交流在驾驶过程中变得日益重要,同时由于言语交流造成司机分心而发生交通事故的情况也非常严重. 目的:本研究从驾驶心理负荷的角度,运用实验室实验方法模拟驾驶操作的同时,探讨言语交流的不同过程对各种环境条件下驾驶操作的影响.方法:本研究将言语过程分为言语的理解与言语的产生,按照言语加工水平分为句子加工和段落加工;驾