基于《说不完的故事》语料库的藏文短语分析研究

被引量 : 0次 | 上传用户:lokimi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
要让计算机来识别藏文短语,则首要的条件是人类先要找出藏文短语的语法规则。凭借着这些规则从真实语料当中找到并提取和分析藏文短语,这样才能计算机识别藏文短语。藏族经典民间文学《说不完的故事》中的序言及十一篇短片故事集作为本文的语料,采用多拉教授的藏文词性标记集为标注依据,以藏语语法对短语的理论前提选定藏文句子并应用直接成分法对语料中的藏文短语进行人工括号标注。这些序言及其十一篇短片故事集中共有7777个藏文短语分为九个类型,分别为名词短语、动词短语、形容词短语、数量短语、副词性短语、时间性短语、特殊短语、谚语和习语。这些藏文短语,从计量、模型、内部结构、外部结构、句法成分,语义角色等六个方面进行分析,最终建立了藏文短语的信息库。本信息库中的1657个名词短语,按结构模型分为六种结构模型;按内部结构分为主格结构、主虚结构、宾格结构、同位结构、并列结构、中定结构和复指结构;按外部结构分为名词性短语和准名词性短语,在句子里充当主语和宾语。其中包含的4270个动词短语按结构模型分为五种结构模型;按内部结构分为状中结构、宾动结构、主谓结构、并列结构和中补结构;按外部结构分为动词性短语和准动词性短语,在句子里充当谓语。包含的347个形容词短语按结构模型分为八种结构模型;按内部结构分为状中结构、宾动结构、主谓结构、并列结构、中补结构和中定结构;按外部结构分为动词性短语、形容词性短语和名词性短语在句子可以充当主语、谓语和宾语。包含的656个数量短语按结构模型分为六种结构模型;按内部结构分为并列结构和中定结构;按外部结构分为数量性短语和名词性短语。包含的287个副词性短语按结构模型分为八种结构模型;按内部结构分为状格结构和并列结构,在句子里充当状语。包含的316个时间性短语按结构模型分为十种结构模型;按内部结构分为复指结构、定中结构和中定结构,在句子里充当时间状语。包含的201个特殊短语,按结构模型分为四种结构模型,其余包含了16个谚语和27个习语。
其他文献
文化是国家和民族的重要命脉,文化建设与国家安全息息相关。军队是执行政治任务的武装集团,担负着保卫国家安全的重大职责,军队的文化建设具有特别重要的意义。回望峥嵘,我军
外教作为大学英语教师中的一支特殊教师群体,其教学特点、英语教学优势值得借鉴和学习,但外教在大学英语课堂教学中也存在一定的不足。本文初步探讨和解析外教在大学英语课堂
在中国儒家伦理学的实践理性原理中 ,由于在概念上未能严格区别开“道德”与“幸福”的本体差异 ,因而在现实世界中总是要面临各种无法摆脱的困境。本文指出 ,中国民族之所以
在现代竞争激烈的高山滑雪比赛中,运动员心理素质水平的高低对比赛成绩起着至关重要的作用。本文是通过分析心理技能训练的作用和意义、高山滑雪运动比赛的心理特征以及影响
<正> 刘××,男,76岁,1989年2月8日初诊。患者自述三天前右下肢肿胀、麻木,行动不便。现肿势增,渐向足背、小腿扩散。症见:面色(白光)白,疲倦乏力,少气懒言。大便偏稀,小便短
期刊
会展活动中,参展商行为是展会成功的关键因素之一。本文以建立影响参展商参展行为决策的数量模型为基础,选取在北京举办的三个典型展会进行实地调研,通过因子分析法萃取主要
本文系统论述了成都商报创办17年来的成功经验、路径探悉、经营管理。其中有艰难的探索,有执着的坚持。成都商报从发展阶段、超越阶段到迈进主流大报阶段的具体做法。17年来
为了使EM I滤波器的传导EM I信号在其内部得到最大衰减,依据EM I滤波器应具有双向抑制性的基础上,分析了阻抗失配对插入损耗和反射损耗的影响,给出了理想EM I滤波器的确定原
农村教学点在农村中小学布局调整过程中面临着师资不足的生存和发展困境,存在教师数量整体短缺、学科结构性短缺及师资质量相对低下等问题,其原因主要是教师编制政策不合理、