【摘 要】
:
多变量信息瓶颈(Multivariate Information Bottleneck)方法是基于信息论的一种多元数据处理方法,此方法能够处理数据压缩与信息保存之间的平衡,有效地发现数据中蕴含的多种潜在
论文部分内容阅读
多变量信息瓶颈(Multivariate Information Bottleneck)方法是基于信息论的一种多元数据处理方法,此方法能够处理数据压缩与信息保存之间的平衡,有效地发现数据中蕴含的多种潜在模式,解决复杂优化问题中算法精度与效率之间的平衡问题。然而,多变量信息瓶颈方法在做数据分析时仅考虑数据的一种相关变量,忽略其它多种重要的特征信息,使抽取得到的数据模式中包含单独特征带来的偏见。针对上述问题,本文在多变量信息瓶颈方法的基础上提出了一种同时处理数据多种特征的聚类算法:mf-MIB算法。该算法采用提取-合并策略,在对数据进行聚类分析的过程中能够同时考虑多种特征信息,为多种特征处理问题提供了一种有效的解决方法。同时,mf-MIB算法能够学习特征与对应的视觉单词之间的语义相关性,缓解语义鸿沟问题对聚类算法的限制。在图像数据集和视频数据集上的实验结果表明:mf-MIB算法能够有效处理数据中蕴含的多种特征信息,算法性能优于原IB算法;相比于k-means算法、NCuts算法和PLSA算法,mf-MIB算法得到更高的聚类精度和标准化互信息,优势明显;此外,mf-MIB算法能够有限迭代次数内有效地收敛到一个局部最优解。本文提出的mf-MIB算法可应用于聚类分析、模式识别、信息检索等领域,并且实验结果表明其能得到高质量的聚类结果。此外,本文提出的mf-MIB算法比原IB算法适用更多种类的数据集,为IB方法提供了一个新的研究思路。
其他文献
旅游合同纠纷的类型多元,因一方的违约,导致对方权益受损现象较为常见。实务中,此类合同纠纷的法律救济面临现实困境,要更好地解决问题,需要通过立法的完善、司法程序的简化
从茄碱的结构分布、分离提取与生物活性等方面进行综述,介绍近年来茄碱的研究进展,分析了研究中存在的问题并展望未来研究方向,旨在为茄碱的应用研究提供参考.
<正> 王巩(1048——?),字定国,号清虚先生,莘县(今属山东省聊城地区)人。史称“巩有隽才,长于诗”。(《宋史》卷三二0)甚至连苏轼都叹为不及。可惜其诗全部散佚,今仅存笔记杂
夸美纽斯体育教育思想是在中西文化交流的大背景下产生的,其体育教育思想是以“泛智”思想为核心的,由其“泛智”思想引申出的体育观包括:提出体育是教育的重要内容、提倡体育
清华美院雕塑系经过近20年的发展,已形成高水平的教师队伍和完整的教学体系,并为社会培养和输送了一大批专业扎实、理论过硬的优秀雕塑专业人才。文脉的传承与发展始终在不断
王巩是三槐王氏第四代中杰出的人物.虽然他在政坛上并未能发挥自己的才能,但一生正直,心胸开阔,深受苏轼兄弟赏识.其生活亦多姿多彩,蕴藉风流.在王氏子弟中,以著述勤快见称,
<正>1962年在伦敦举办的第一次关于设计方法的学术会议,被认为是确立设计方法学和设计方法运动的标志性事件。设计方法学是上世纪60年代兴起的一门学科,主要用来探讨设计的一
天然气是我国使用量非常大的一种能源,由于需求量非常的大,所以容易导致行业的垄断。为了防止天然气的垄断行为,我国政府对于天然气进行了一定的规制,但这种规制却又是受到多
钢材落锤撕裂试验(DWTT)作为用来表征材料韧脆性的试验项目,能够反映其断裂的真实情况。DWTT断口评定结果是对船舰钢板、管线钢等材料的断裂韧性的评价和质量验收的重要指标。然
随着社会的不断发展,国家对能源的需求必然会随之增加,在我国能源结构中煤炭目前以及往后很长的一段时间内将占据着重要的地位。但是随着煤炭需求的增加和不断的开采,矿井巷