汉藏音译方法的研究与实现

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:huayuaneee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏族是我国人口众多的少数民族之一,在藏语使用地区也是多民族、多语种、多种宗教共同存在。随着时代的发展,各民族间的交往日益频繁。为了促进汉藏语言交往使用,语言文字的交流需要更简便,更加规范。随着少数民族地区的开放的程度不断提高,我国各族人民在社会交往中,除了使用本民族语言,汉语即我国的通用语言文字——汉语普通话,也迅速普及。受汉语言的影响,少不了将汉文词语引入到藏文中,很多专有名词像人名、地名等都不会意译,而是音译过来使用。例如像新闻媒体等进行藏语播报的时候,就存在将国家领导人的名字进行音译。但是由于目前没有统一的规范标准,像同一名字出现在不同地方,可能就有不同的译法。因此,有效、统一、规范化的汉藏音译实现,在跨语言检索等信息处理中起到重要作用。根据汉文构字、汉语拼音以及藏文字符的用字规律等特点,本文总结提出了基于规则的汉藏音译方法,将音译过程所需的条件,归纳为一条条的规则,在此基础上设计算法,实现了汉藏之间的音译,取得了很好的效果。  首先,根据汉语拼音,以及拼音读音与藏文字符的读音相似关系,制定了汉语拼音与藏文字符相应的对照表,该表囊括了目前汉字的所有常用拼音。  其次,汉语拼音和藏文字符的对照表是以字作为基本的处理单元,但由于很多词或词组存在现有译法,本文还建立了一个特殊词表,该表列举了很多沿袭的通用译法,即人们的习惯译法的词或者词组。  再次,汉字存在多音字,但如果只是声调的不同,在音译为藏语是没有差别的;如果拼音不同,则会译为不同的藏文。所以如果待译汉文出现多音字,需要根据语境选择准确的拼音,根据上下文来选取合适的藏文,针对此,建立了一个动态多音字词库,该词库包括一些多音字构成的常用的词或者词组和其相应的拼音。  最后,本文采用基于规则的方法实现汉藏音译算法,该算法中,设定了特殊词优先级最高,多音字动态词次之,最后根据汉语拼音与藏文字符对照表单个字处理汉文。系统测试证明,该算法实现简单,准确率高。
其他文献
数据库安全涉及到数据库中数据的机密性、完整性、可用性。目前,大部分研究集中在如何保护数据库免受损害,很少有研究数据库在面临着一些成功的攻击时,如何提高自身的容忍能力。
Internet作为信息传播的工具已经应用得十分广泛,在电子投票、电子商务尤其是军事机构等诸多领域对通信双方的身份隐藏是一个基本的要求,因此,兴起了对匿名通信技术及其安全
校园信息门户平台就是指在Internet的环境下,把各种应用系统、数据资源和互联网资源统一集成到校园信息门户之下,根据每个用户使用特点和角色的不同,形成个性化的应用界面,并
无线通信技术是传感器网络的一个非常重要的组成部分,实现传感器网络节点之间的数据传输,无线通信是基础。由于传感器节点具有电源能量有限、通信能力有限、计算和存储能力有
支持向量分类中,高斯核不区分样本中各个特征的重要性.显然,各个特征对分类的贡献一般是不相同的,为了体现这种差别从而提高支持向量机的泛化能力,文中提出了多宽度高斯核的
生物特征识别是利用人体所固有的生理特征或行为特征进行识别的技术,它涉及到模式识别、数字图象处理和人工智能等众多学科的相关知识。近年来,由于单生物特征的局限性,很难
随着网络技术的快速发展和网络应用环境的不断普及,网络安全问题日益突出。在传统的加密和防火墙技术已经不能完全满足安全需求的同时,入侵检测技术作为一种全新的安全手段,越来
当场处罚决定书是工商行政管理执法的重要结果,其公正性和严密性对行政执法公开形象具有重要影响。本文以徐州贾汪区工商行政管理执法为应用场景,探讨基于专家系统和水晶报表技
互联网的发展使传统媒体正在向网络媒体转变,新闻出版业逐渐迈入网络时代,由此产生了网络新闻。近年来随着网络新闻数量的剧增和用户要求的提高,新闻服务系统的个性化服务提供成
摘 要 集群技术与作业管理技术的有机结合,产生了基于集群技术的作业管理系统,它将物理上分散、异构、自治的计算机通过网络连接成集群,并通过软件实施有效的分布资源管理,