论文部分内容阅读
多媒体场景本质是视频音频等多模态信息交互融合的结果,尽管每个模表达了一定的语义,但是多媒体场景完整表达要通过多模态信息去共同体现,本文提出使用视频音频双模态特征融合技术形成的超级隐马尔可夫链进行多媒体场景识别,实验数据表明,与只使用单模态信息识别多媒体场景的方法相比,超级隐马可夫链取得了更好的识别正确率.