基于内容的音频指纹提取技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yyfdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于海量存储技术与计算机网络技术的高速发展,互联网每天都更新海量的音频信息,使得如何从海量音频信息中检索到所需信息成为亟需解决的问题,从而促成了音频指纹技术的产生。目前音频指纹技术还处于探索研究过程中,很多技术还不够成熟,已有算法都有各自的缺点,一般存在着特征反映不全面、抗线性速度变化攻击的鲁棒性差和指纹尺寸过大等问题。弥补这些缺陷将会提高算法的识别率和对比效率,从而在实际应用中具有重要意义。针对基于内容的音频指纹提取技术,本文从时域特征、频域特征和时频域特征三个方面,研究了国内外多种音频指纹算法,提出了一种改进的MFCC算法和一种基于db4小波统计特性的指纹算法。其中,本文提出的改进MFCC算法改善了MFCC算法对中高频特征不敏感以及缺乏动态特征的缺陷;而本文提出的基于db4小波统计特性的指纹算法,改善了一般算法抗线性速度变化攻击鲁棒性较弱的缺陷,并减少了指纹存储空间。实验表明,本文提出的改进MFCC算法在各种攻击处理下表现出比传统MFCC算法更好的鲁棒性和更高的识别率;本文提出的基于db4小波统计特性的音频指纹算法,不仅对常见的保留信号内容的攻击处理及加性高斯白噪声具有很好的鲁棒性,而且对线性速度变化攻击也具有良好的鲁棒性,另外,其生成的指纹尺寸也比较小。在后续的研究工作中,还需要对指纹尺寸的改善和抗某些攻击的鲁棒性深入研究,从而提高算法效率和得到更高的识别率。
其他文献
徐乃昌是晚清民国时期活跃于江沪浙政坛、文坛的一位著名词人,影响很大。但当前人们对其研究的成果多集中在藏书、出版方面,同时,当下民国词研究整体上十分薄弱且多集中于知
《清明上河图》是北宋画家张择端描绘东京汴河两岸及城郊风貌的风俗画。通过图像分析法,以《清明上河图》为底本,从其城市背景及画面场景入手,基于画面本身展示的城门内外街
<正> 马铃薯、棉花、春甘蓝、秋甘蓝(或秋花椰菜)四种四收间作套种模式,是以马铃薯、棉花为主茬,间作甘蓝(或花椰菜)。该模式在基本不减少棉花产量的同时,增加了经济效益。一
无锡近代园林作为由古典园林向着现代园林转型的中期,因其历史赋予而展现出新的形态和新体系。充分调研1840—1949年间具有典型性的无锡近代园林,结合其地理环境、景观属性、
目的探讨全麻下双导丝逐级引导Y型气道支架置入术的方法和临床效果。方法回顾性分析接受气道一体式Y型支架置入术的12例患者的临床资料。全麻下采用双导丝逐级引导技术置入支
1选题理由长期以来,电压合格率偏低都是门头沟地区电网的一个重要问题。受地域广阔,线路较长等客观因素的限制,门头沟电网的电压合格率一直未能达到北京市的平均水平,给用户
一词多义现象一直是语言学研究领域的热点话题。传统语言学家认为心理词汇的构成是任意的,并且是依赖语境的;他们将研究的重点放在句子层面,主要探究空间介词与其他词类在句子
<正> 曲阜市有旱地12万亩,多数年份为适雨种麦,即在小麦适播期内降雨适墒种麦,否则,白茬越冬,翌年种植春播作物。1997年秋种期间,因干旱缺墒,小麦播种适期过后,全市仍有较多
适应居民的游憩需求及其行为特点是提高公园管理水平的关键措施,也是提高居民幸福感的重要组成部分。利用GPS所具有的行为连续跟踪、可定点定时等技术优点,结合问卷信息采集,以共青森林公园为例开展游憩行为差异性实证研究,发现公园游人空间分布的年龄群体差异性。游人空间分布具有群体集聚性、等级性特征;影响群体游客空间分布的因素是多方面的,1级节点主要受与主要出入口距离的影响,2级节点主要受大中型设施的影响,3
2016年5月29日,由市妇女儿童培训活动中心主办的“爱心童享.快乐同享”庆祝“六一”系列活动之“宝贝向前冲”亲子同乐会,在南岸区万达广场举行.该活动提前向社会发出了“和