汉语语音处理系统中自动分词的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:quake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机通信研究的不断深入,语音合成技术越来越受到各国学者们的关注。语音合成系统要想提高其合成的语音的自然度,关键的第一步就是汉语自动分词问题。汉语自动分词是中文信息处理中的重要课题,国内外的许多学者在自动分词领域进行了富有成效的工作,但是,在提高分词精度的问题上仍然存在着很大的困难。汉语自动分词,首先必须就影响汉语分词精度的语言现象做针对性的研究,从本质上把握问题;其次,就是对分词算法进行有效的设计改进,提高其分词能力;最后要对分词过程中的信息和分词后的处理进行深入的研究。本文对自动分词问题做了全面的分析研究,分析比较了当前主流分词算法的特点,介绍了目前比较成熟的几个分词系统,详细阐述了自动分词问题的难点之— —歧义切分的起源和处理方法;最后详细说明了根据语音输出的实际需要设计的分词系统的分词词典以及自动分词系统的具体设计和实现。实验表明,所实现的系统在分词的准确率和歧义切分等方面了都获得了较好的结果。
其他文献
近年来,随着计算机技术的快速发展,分布式计算作为现代新技术的产物,得到了快速的发展。当分布式系统环境大规模出现在军事、航天、灾难救援等需要相互协作共同完成某个目标
生物信息学是运用信息学手段对生物数据进行整理、分析和提取的一门新兴交叉学科,蛋白质组学的研究是其中非常重要的方面。而计算机科学中的数据挖掘技术是对大量数据进行分
随着网络与视频技术的迅猛发展,数字化视频监控技术在全社会得到了广泛应用,如公安天网系统,道路视频监控系统,以及众多的商场、社区和楼宇视频监控系统等。这些系统能实时记录和
考试是教学至关重要的一个环节。随着时代的进步和科技的发展,考试的方法也不断发展变化。传统的考试方法费时费力,各环节容易存在安全隐患。随着计算机的普及以及网络性能的
自然语言处理是人工智能的一个重要分支。汉语自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理的一个重要问题。汉语自动分词系统是利用计算机对汉语文本进行词
  本文提出了一个结构化对等网络模型MCAN,实验结果表明,MCAN系统可以进一步提高路由效率;将MCAN系统应用到电子商务资源管理中,实现电子商务资源的分布式管理、发布和查询;结构
本文介绍了四种基于用户知识的主观兴趣度度量,即规则确定性、条件意外性、结果意外性和二者意外性,并对它们的算法进行了改进。最后提出了一个交互的模型来帮助用户发现有
软件工程与项目管理是成熟而博大精深的学科。在关系到软件项目成功与否的众多因素中,软件度量、工作量估计、项目规划、进展控制、需求变化和风险管理等都是与软件工程管理
本文对当前WEB应用程序开发平台中面对企业集成化出现的问题进行深入的研究,并结合XML技术,利用其规范性、自描述性、数据表达的灵活性等特点提出了针对此问题的解决方案—基