齐普夫定律在中文短语构建中的呈现

来源 :第一届两岸三地科学计量学与信息计量学研讨会 | 被引量 : 0次 | 上传用户:longerken
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证.实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证.实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律.这个现象表明,从计量角度而言,汉语短语具有其内核概念,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核概念进行构建,同时又要根据不同语境进行拓展.这个现象一方面从计量角度揭示了汉语短语构成的分布规律,另一方面对于中文信息处理中的短语识别、自动句法分析等研究具有重要影响.
其他文献
China & Vietnam provide an interesting setting to evaluate the relation between incentive structures and financial performance due to conflicting cultural values which make it unclear whether group or
在理论上,缺乏「互动性」的教学,学生学习成效必定比具高互动教学方式差.在商管领域方面课程,通常需要具备高度创意的发想,才能引领学生在学习上产生成效.一般教师仅会于课堂上讲授相关知识,最多再加上本身的经验谈,学生的社会经验与生活体验若明显不足时,教师在教授相关课程时往往很难获得共鸣.行销是一门有趣的课程,它包含传播理论、文化理论,甚至商品推广时,还必须注意到消费者的心理.在讲授「顾客服务」此一观念时
随着时代不断地进步,观念不断地革新,主计工作也必须与时俱进,才能跟得上时代的脉动与社会的需要,尤其近年来国防部以人力精简为主轴的方式推动「组织再造工程」,规划在有限的人力资源下,以更有效率的方式处理多样化的国防专业事务,主计机构应运用资讯科技技能以改进工作方法与革新业务,期能在各项的专业领域上,能作出更多的贡献.就以政府E化目标的观点来看,导入「政府岁计会计资讯管理系统」Government Bu
本研究将以纺织业为例,进行研究假设的关系验证.本研究主要动机是探讨纺织业员工的工作特性、工作满意与离职倾向之间的关系,并根据学者所提出的理论与实证研究,以期望可凝众员工对整体组织的向心力,进而有效达成组织的经营目标.并建议公司能常检视自己在员工中的真实地位,才能避免员工一再地流失,具体做法有:时常给员工填写工作满意度问卷,让员工匿名表达自己的想法,以及多一些开放性的问答,让员工写出心中的意见,也可
本研究重点在技职生职场情绪素养之衡量项目与实务表现上.并将情绪素养的理论架构整理成认识,认知,反省,改善等四大主轴;然而在与技职生座谈与初步调查后,为避免受访者误解或难以回答,而将实务调查的内容改以认知,反应,处理为探讨主题.在资料搜集方面,以开放性问卷配合人员访问方式将受访者的视身经历详实登录;在资料分析方面,以内容分析法进行类目及单元的构建;目的是要确实了解职场上的技职生在面对情绪问题时的认知
由于历史和地域的原因,馆藏档案完整性建设一直是档案馆长的重要课题.想方设法地丰富馆藏也成为档案馆的重要任务.但是档案本身的不可再生性和稀缺性又给这项工作带来了很大难度.本文首先说明了长春市赴境外征集档案的必要性,然后论述了长春市档案馆抓住机遇,拓宽工作领域,主动出击,把征集散存在社会上的重要档案资料作为档案馆的一项常态化工作加以推进。最后总结了长春市借助举办展览、出版编研成果等工作,在现有馆藏档案
为应对电子文件管理面临的挑战,在高层次上寻求解题之道,借鉴国内外最新成果,结合自身特点,为电子文件中心建立了系列模型,首先介绍了信息模型是一揽子解决方案,它定义了电子文件元数据标准、文件格式需求、信息封装结构,并论述了结合大陆“档J清”,理论联系实际,实施“标准先行”策略,标准引导实践,实践检验标准,在5个省直单位同步开展了信息模型标准验证工作。信息建模的过程历经3年8个月,电子文件中心建设的过程
本文首先说明了档案文献的重要作用和意义,然后分析了赴国外收集复制档案主要有专业公司代为复制、自行复制、交换复制件和接受捐赠方式,最后论述了从国外复制的档案资料,丰富了青岛市档案馆的馆藏内容,为我市开展历史研究、传承历史文化等方面,发挥了重要的作用。
分类号是反映学术论文研究内容的重要途径之一.根据中图分类号,对CSSCI收录的14种学术期刊发文进行了统计分析,并利用期刊-分类号网络研究了期刊与分类号之间的关系.研究发现,14种图书情报学期刊的发文内容有非常强的稳定性;同时,分类号位次的变化又反映了期刊发文的动态性.根据分类号信息,可能将这14种期刊分为,G35、G25和其它类三种类型.指出在论文评价过程中,分类评价是非常重要的一条原则,分类号
本文提出一种基于主题模型的专利分析方法.通过对专利文献中名词短语的抽取及主题模型分析,深入专利文本内部实现专利文献内容的计量研究.进而揭示出某领域的专利技术研究热点及子领域研究方向,挖掘专利知识间的结构和内在关系.将机构—主题概率层次加入主题模型中,实现主题模型改进.可以清楚的辨识出各个热点主题中的主要竞争企业.并以通信产业4G核心技术领域LTE专利为案例,进行了实证研究.指出在专利情报分析中,研