语料初级加工系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wangzhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究汉语的语料初级加工过程,并将汉语纳入以词法、句法、语义等为基础的层次分析的体系中,因此将该过程分为三个部分:自动分词、词性标注及句法分析.在整个语料初级加工平台内,该文分别论述了自动分词、词性标注与句法分析的处理过程,研究了这三个系统所使用的方法技术.
其他文献
正交表是一类极其重要的组合结构,这一概念包括了拉丁方、正交拉丁方、射影平面、Hadamard矩阵等重要概念.该文对正交表的性质进行了深入的研究,从理论上给出了用拟物方法搜
该文共分六章.第一章论述数据开采的意义、内容、挑战、应用和系统框架;第二章阐述数据噪声的消除策略、自动的提取数值型和非数值型概念层次的方法;第三章讨论多层次概念数
该文根据国内电子制造业的实际情况,设计并实现了一种基于中心数据库的CAD/CAPP/CAM集成方法.此集成方法已应用于国家863项目武汉邮电科学院CIMS二期工程,不但提高了系统信息
本课题是针对空间辐射生物学实验装置中生命保障所需的温控问题而开展的研究。空间辐射生物学实验源自国家“十一五”民用航天返回式科学实验卫星项目“空间辐射对基因的作用
随着WWW成为丰富而庞大的信息来源,对大量信息进行自动自理是亟待解决的问题, 因为通过人工浏览,单个地处理WEB页面的方法是远远不够的.作者发现许多信息源是以相 对稳定和结
该文从加强决策支持系统决策信息的能力出发,探讨了一些决策支持系统的新的技术如数据仓库、数据挖掘、联机分析处理等.对决策支持系统中的预测及仿真技术,该文作了较全面的
该文目的是介绍笔者给出的一种模糊定义和相应检测方法.对于给定两个端点的标准线段,可以计算图象中任何一个点集的线性程度和标准线段的存在程度,结合它们可以定义一个隶属
该文首先回顾了基于广域网计算系统的研究现状,论述和分析了前人的工作,认为目前的解决方案并不十分完善,尚有很多需要改进的地方.提出了计算资源发布(CRP)的概念,并建立了一
随着计算机技术的发展,尤其是Internet网和多媒体技术的发展,基于因特网的多媒体会议系统飞速发展.该文首先讨论了当前语音压缩技术的发展,介绍了音频信号处理的基本概念和一
该文从帧中继的用户平面和控制平面两个角度出发,通过GAISCN网络的研究和实现,重点分析和阐述了一套基于帧中继技术的综合业务专用通信网的实现机制.