多变量IB方法的协作模型及算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:SK_flyfox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
IB方法(InformationBottleneck)通过对数据的压缩来分析其中所蕴含的内在模式,在机器学习、模式识别等众多领域中取得了成功的应用。多变量IB方法(MultivariateInformationBottleneck)是对IB方法的拓展,采用更多的变量来抽象现实问题,让更多的信息参与到数据的压缩中,通过它们之间的互相配合共同完成更具挑战性的数据分析任务。  多变量IB方法为多元数据分析问题提供了理论框架,其协作模型是对数据分析任务高度抽象化的一种形式,刻画了变量之间的协作关系,为数据分析任务目标函数的确定提供了依据。一个好的协作模型可有效利用领域问题中所有有价值的信息来完成数据分析任务。算法则实现了对目标函数的优化,事关数据分析的效率及目标函数的优化程度。协作模型与算法均是多变量IB方法研究的核心问题。  本文从双向压缩、无冗余多视角聚类、多特征变量信息融合和选择性数据分析四个问题出发,重点研究多变量IB方法的协作模型与算法,主要成果有:  (1)提出交叉对称IB协作模型(ICSIB),将压缩之前的原特征变量引入到对称IB的双向压缩中,解决对称IB中特征信息损失问题。ICSIB算法采用交错的“抽取-合并”顺序迭代过程对ICSIB目标函数进行优化,理论上保证收敛到目标函数的局部优解,具有较低的时间和空间复杂度。实验表明,在原特征变量的协助下,ICSIB算法所得到的数据双向压缩模式更接近于数据中真实的内在模式。  (2)提出无冗余IB协作模型(NrIB),将已知数据划分信息以负变量的形式融入到数据的压缩中,使它们协助IB方法挖掘一个新的高质量聚类模式。NrIB算法既适宜于分析共现数据又适宜于分析欧氏空间的非共现数据,可挖掘出数据中线性及非线性可分模式,无需额外参数来估算欧氏空间中的信息量。实验表明,NrIB算法可有效地利用已知数据划分信息来学习一个无冗余高质量的聚类模式。  (3)针对多特征变量信息融合的问题,提出多特征IB协作模型(MfIB)与基于数据局部一致性特征的IB协作模型(LCIB),使得多变量IB方法可在多种特征信息的协助下共同挖掘数据中所蕴含的内在模式。实验表明,综合考虑了多种特征信息的MfIB算法与LCIB算法可更有效地发现数据中所蕴含的真实模式。  (4)提出一个具有数据选择分析能力的DSIB算法。该算法采用顺序“或抽取-或合并”的策略来优化DSIB目标函数,可有选择地对数据进行模式分析。论文从理论上证明了该优化算法可在有限步骤内收敛到目标函数的局部优解。实验表明,DSIB算法可更好地发现数据中凝聚性强的簇模式。
其他文献
随着互联网行业的快速发展,我们正处在一个信息快速增长的年代,并且在海量增长的信息中往往蕴含着大量有价值的数据。虽然在日常生活中,我们可以通过各种搜索引擎解决我们的
由于无线传感器采集到的数据信息精准、部署比较简单、成本较低且不需要现场维护等特点,无线传感器网络目前已经成为一个研究的热点。无线传感器节点一般直接布置在暴露的地理
近年来,由于人们对视频效果要求不断提高,而国外垄断着视频编码标准核心技术,并且专利费昂贵,中国自主研发并达到国际先进音视频编码标准的AVS(Audio Video coding Standard)应运而
学位
移动群智感知是指移动用户通过随身携带的电子设备来采集数据,并且协作完成复杂任务。最近数十年,随着智能手机、车载电子设备、可穿戴式设备等大量的移动终端设备的普及,可以利
随着移动智能终端的日益普及,移动互联网的飞速发展,移动用户规模不断壮大,各种业务和应用不仅直接影响到了人们的工作方式和生活方式;同时也对人们的学习工具和学习过程产生
推荐系统在数字图书馆中有着重要作用。通过帮助用户发现他们感兴趣的图书,推荐系统既充分利用了数字图书馆的资源,也更好满足了用户的阅读需求。传统基于内存的推荐方法是有效
在现代生活中,每天都有大量的视频数据不断涌现,人们怎样才能从数量众多、类型多样的视频数据中找出自己所需的视频片段已经成为一个新的问题。但是由于视频数据信息量大,内容复
无线传感器网络是当今物联网的关键技术之一,是一种多跳无线自组织网络,由大量的微型传感器节点所构成。它的主要特点是低功耗、低成本、分布式和自组织,但是网络中的每一个
EDF是1973年由海外学者提出的一个实时调度算法,作为一个经典算法,它出现在很多的实时系统教材中,至今尽管己跨越了数十年的历史,但关于EDF的动态性能方面,仍有许多问题有待