论文部分内容阅读
近年来,随着信息技术的迅猛发展,在人们的日常生活中各种各样的视频信息随处可见,目前的电影预告片、广告等视频经常在一些在线社交网络(Online Social Networks,OSN)中预先投放。在视频的设计和生产过程中,怎样设计视频更能够吸引观众的注意,对观众的情绪产生正面的影响,从而提高此类视频的观众口碑和销售业绩,产生经济效益,这是相关文化企业、视频指导者、编辑者非常关心的问题。为探究商业视频底层视觉特征对其受欢迎程度的影响情况,需要对视频底层特征进行提取,在获取原始视频数据及其观众评价之后,采用特征选择方法提取对评价影响较大的特征。本文针对目前广泛应用的互相关特征选择(Correlation-Based Feature Selection,CFS)方法进行改进,提出了CFS-Spearman特征选择算法,采用Spearman秩相关系数与CFS方法结合进行特征选择。选取UCI机器学习数据库中的3组数据作为实验数据源,将本文特征选择方法与传统的CFS方法及最小冗余最大相关(minimum redundancy and maximum relevance,mRMR)方法进行比较,通过KNN、SVM分类器验证各候选集的优劣,证明了文中方法的效果。最终将本文的方法应用于商业视频底层特征选择,选出了对视频受欢迎程度影响最大的特征子集。再用KNN、SVM方法对特征进行分类及验证性实验,结果证明选出的运动方差、亮度均值、饱和度均值三个视频底层特征会对观众的评价造成一定的影响,至此预测模型已建成。通过ROC曲线验证了CFS-Spearman方法与SVM结合优于CFS-Spearman方法与KNN的结合,从实验结果看出CFS-Spearman方法与SVM结合更适合此方面的研究,这一研究成果为以后更进一步研究奠定了基础。