普通话音节时长与其所携带信息量关系的语音实验研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lulswhzx512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
言语交流是日常生活中最重要的活动之一,而言语交流的实质是一种人与人之间信息交互的方式,既然是信息交互,那么每一个独立的语音单位都携带着其独立的信息量,从这个立足点出发,文章从语音时长的角度探索其与信息量之间的关系,结合信息论中的霍夫曼编码原理与互信息理论进一步解读语音时长和信息量之间的关系。文章以普通话为研究客体,实验语音材料的来源均来自中央人民广播电台,包含新闻、娱乐、生活、教育等各类广播节目,保证了材料的多元化。利用语言分析软件praat对语句进行独立切分并获得每个语音单位的时长且进行统计,为确保时长之间横纵向比较的公平,所有数据都进行了归一处理。建立时长数据库后,再从语音个体出现在现代汉语中的频率入手,通过信息量计算公式得出其在信息论意义上的信息量,结合二维图和计算将音节时长和信息量进行联系,论证两者之间存在的联系。本文分为四个部分:第一章为绪论,主要介绍了实验语音学的背景,关于音节时长的国内外研究现状,以及文章研究的目的、意义和方法;第二章为音节时长数据收集与统计,本章分为三个部分,首先对实验材料来源和语音软件praat进行简单介绍;然后将实验材料来源和实验步骤,数据收集并如何建立数据库进行详细说明与解释;最后一部分说明数据归一处理的必要性和重要性;第三章为音节时长与信息量之间的研究,本章作为文章的核心章节分为四部分,第一部分对信息论中的信息熵和霍夫曼编码进行简单的说明;第二部分根据研究需要对所有的实验数据进行了分类,并对数据的抽样进行说明;第三部分通过信息熵的计算方法得出所测音节包含的信息量,之后通过将音节时长分为时长最大值、平均值和最小值分别进行联系比较,最后得出时长与其携带信息量之间确实存在联系,主要表现为时长较长的音节其所携带信息量较大,时长较短的音节所携带信息量较少;第四部分从互信息量入手得出信息量和音节时长之间的关系;互信息量的采集涉及工作量较大且需要找寻音节之间的交互关系,因此本文在此部分只做了一小部分的测试来查看两者之间的关系,通过计算所测短时音节的互信息量得出了时长较短的音节所携带的交互信息量也较小的结论。第四章为结语,本章梳理了全文的脉络,并进一步说明第三章得出的音节时长和其携带信息量以及霍夫曼编码之间的关系;同时也说明了文章研究有待改进的地方,并对将来进一步的研究做了展望。文章通过实验语音学得出普通话音节时长与所携带信息量之间的关系,从一个全新的角度去探索语言和信息论之间存在的联系,并希望通过本文为语言学和计算机科学的交叉研究做出微薄的贡献。
其他文献
澄清高校学术规范教育的基本问题具有重要的理论与实践意义。从学术规范教育的必要性、根本目的、重要作用、基本原则等方面深入研究后可发现:当前高等学校加强学术规范教育是
从非线性视角出发,文章首先采用门限向量自回归模型研究了汇率传递与通货膨胀之间的非线性关系,发现汇率变动对通胀具有显著的"门限效应"。随后,文章利用广义脉冲分析方法分
随着我国科学技术不断变化升级,化工产业也取得了不错的发展前景。但是有不少的调查数据显示,有很多的企业都只追求自身的发展,而严重的轻视环境的保护工作,以牺牲环境为代价
目的检测脓毒症患者血浆血栓调节蛋白(TM)和基质金属蛋白酶9(MMP9)水平,探讨它们对多器官功能障碍综合征(MODS)早期诊断和预后判断的意义。方法采用酶联免疫吸附测定法(ELISA
案例研究是公共行政领域使用最多的研究方法之一,案例研究应致力于理论建构。通过案例研究来构建理论使用的是小样本分析策略,其并不要求案例的代表性,而是更为注重对案例的
目的:探讨磁共振成像(MRI)在剖宫产后中期妊娠引产中的作用。方法:回顾性分析48例剖宫产后中期妊娠引产的临床过程及MRI表现。结果:MRI能够清晰显示剖宫产切口瘢痕愈合情况,
<正>肥胖儿干预工作离不开幼儿园、家庭之间的相互配合,每学期幼儿在园期间体重控制得较好,基本上都能按照园内肥胖儿干预方案有计划、有步骤地实施,成效较明显。但往往到了
固定资产是医院开展医疗活动的物质基础和重要保障,随着医院医疗水平和护理质量的不断提高,固定资产与日俱增,如何安全、合理、充分地利用固定资产,有效加强国有资产管理,对
文章基于外商直接投资溢出效应和技术研发效率两个视角,理论分析了金融发展对出口净技术复杂度的影响机制,指出越高的金融发展水平其能够提供的融资规模及效率也越高,同时提