一种基于音频词袋的暴力视频分类方法

来源 :上海交通大学学报 | 被引量 : 7次 | 上传用户:sxx1203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG-7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG-7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确
其他文献
高层住宅之忧宋淑运一座座高楼大厦拔地而起,蔚为壮观。于是,高楼林立常被用来形容城市欣欣向荣的景象。人们常以城市高层建筑的多寡来衡量该地区的发展水平,总以为在高楼大厦里
北京奥运会闭幕式让全世界都认识了一个不拘小市的伦敦市长鲍里斯·约翰逊。
提出一种简化的电火花线切割极间流场模型,分析了平板长度及其运动速度和缝隙宽度对压差流和剪切流的影响,以及复合后的间隙流场,通过对高速走丝电火花线切割机附加共轴式高
为准确预报分析导流缆拖曳系统的宏观(整体)运动,同时为避免模型过于复杂致方程系数难以准确获取而显得没有实际意义,提出了一个准动态四自由度运动模型以描述导流缆的运动,并
为了对抗网络传输中可能出现的大规模自私行为,提出了一种计算网络最大流(最小割)期望值后再进行网络编码的方法.首先计算网络可能出现的最大流值和它们出现的概率,然后利用这些数
近些年来,我国的建筑施工行业得到了非常迅猛的发展,建筑施工市场的竞争也越来越激烈,对于建筑施工企业的财务控制提出了越来越高的要求。财务控制对于提高建筑施工企业的经营管
通过圆筒拉深试验研究了1200MPa级超高强度双相钢板(DP1200)和纯马氏体铜板(M1200)的极限拉深成形性能,采用扫描电子显微镜观察分析了铜板的微观组织形貌与结构,探讨了其微观组织结
【正】 nVIDIA日前正式公布了GeForce3MX芯片的详细规格,让我们一起来了解一下。 800百万像素/秒(GeForce3为1600百万)填充率支持DVD/HDTV动态补偿支持MPEG-2解码,最大分辨率
随着我过经济社会的不断发展,不论是生产还是社会生活都对能源供应需求量在不断的扩大,人们对电力的需求增长更是尤为明显,因此供电企业保障安全生产至关重要,安全工作关系到