论文部分内容阅读
听觉流的知觉成组是听觉场景分析中的基础研究内容之一,从中获得的听觉感知规律及认知机制对于更好地理解鸡尾酒会问题有重要的意义,同时也为建立基于听觉认知原理的智能化语音信号处理模型有着巨大的理论意义和参考价值。本论文从听觉流知觉成组和跨感觉通道整合两个角度入手,重点研究了不同特征因素在听觉流知觉成组和跨感觉通道整合中的作用及其认知原理,并为基于心理声学的模型研究做了设备和理论准备。本论文的研究内容和创新点如下: (1)利用听觉Ternus范式研究了时间、空间和频率因素在短听觉流知觉成组中的作用,通过听觉的似动序列构造出短的听觉流序列,避免了以往研究中的建立过程的产生,实验结果突出了时间和频率因素的调制作用,实验分析表明短听觉流序列的知觉成组发生在低认知层次的感知加工阶段,实验结果为多感觉通道的似动现象增加了证据,并为进一步研究听觉流的知觉成组提供了实验依据和理论参考。 (2)利用间断转移错觉效应结合视觉Ternus似动范式,研究了竞争条件下的听觉知觉成组对于跨感觉通道知觉成组的影响,实验结果表明听觉知觉竞争在时域上改变对视觉通道的感知,间断转移错觉范式提供了复杂的更接近真实场景的听觉刺激,描述了一种动态的听觉与视觉的同时掩蔽现象,具有重大的生态显著性和现实价值,为进一步揭示鸡尾酒会问题提供了范式参考和理论支持。 (3)开发了音视频协同的专业心理声学实验平台,可以构造更加复杂、贴近真实声场环境的听觉刺激,并基于实验平台为下一步建模工作做了实验设计,通过听觉似动序列违反考察对运动声音的定位及听觉空间编码,通过目标单词识别来探索语音的时域感知及进一步的语音识别模型。