非独立同分布可学习性理论与算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:houyangpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习理论对机器学习的发展有着重要的指导与支撑作用,可学习性(又称PAC可学习性)是机器学习理论研究中的一个基本问题,探讨学习问题是否存在多项式时间开销和样本复杂度、可获得高精度学习器的学习算法。传统可学习性理论通常基于数据独立同分布的假设,然而数据分布在真实应用中往往随时间、空间变化而改变。本文对非独立同分布可学习性理论与算法进行研究,主要取得了以下创新性成果:1)提出了非独立同分布下平均稳定性理论概念,证明了平均稳定性与可学习性之间的等价性。本文通过平稳β-混合序列刻画非独立同分布中随时间变化而逐渐减弱的依赖关系,利用独立块技术,理论上给出了非独立同分布下可学习性的充要条件,解决了非独立同分布的可学习性问题通过平均稳定性来刻画,使得稳定性理论框架得以发展,可用于更多类型的非独立同分布研究。2)提出了一种基于平均稳定性的重要性采样随机次梯度下降算法IS3D(Importance Sampling Stochastic Subgradient Descent)。该算法通过重要性采样来刻画非独立同分布条件下数据依赖关系随时序间距增大而减小的特性,利用随机次梯度下降方法求解。理论上证明该算法在非独立同分布条件下具有平均稳定性和收敛性,并通过实验验证了方法的有效性。
其他文献
许多机器学习问题的目标都是要寻找具有低秩结构的矩阵,例如矩阵恢复、协同过滤、多任务学习等。这类问题可以通过核范数正则的优化问题来求解,它的优化目标是核范数与某损失
随着Web 2.0的兴起,互联网已经成为一个更加开放的信息空间,用户更多地参与到信息的交互过程中,社会化问答服务逐渐变成一种流行的解除疑惑的重要途径,同时也成为网络上知识
工业机器人的运行精度和工作效率以及机器人的低冲击运行是机器人重要的研究方向。本文从规避机器人奇异性、对关节摩擦进行补偿以及从机器人的关节空间出发进行轨迹规划算法
近年来随着人工智能的兴起,基于神经网络等人工智能算法的建模方式在理论和解释性上都已经得到了很大的发展,并且已经通过神经网络解决了一些实际应用中的问题,如:在计算机视
在医学领域,计算机X射线断层(Computed Tomography,CT)、磁共振(Magnetic Resonance Imaging,MRI)和超声等医学图像在疾病的诊断和治疗中占据重要地位,准确地对医学图像进行
振动压路机是路面铺设和维护的关键设备之一,其工作原理是利用自激振动压实路基。因此,振动压路机的一级减振系统较多采用传统橡胶减振器最大限度地限制自激振动向上车的传递
口腔锥形束 CT(cone beam computed tomography,CBCT)具有成像清晰、辐射剂量低的特点,在牙科疾病和牙齿问题的研究中已成为必不可少的影像学技术。在计算机辅助分析中,对口
软体机械臂以其自由度多,运动灵活,环境相容性好,适合于人机交互作业的优势受到了越来越多研究者的关注。但与刚性机械臂相比,软体机械臂的负载能力低,难于胜任钻孔、装配等
随着智能制造业的不断发展,自动化的生产线需要更高的效率和安全,对作为主要执行机构的工业机器人高精度控制提出了更高的要求。传统的基于运动学的位置控制通过运动控制器给
栓钉连接件主要使用在组合结构湿接缝处,而湿接缝在组合梁桥整体的受力过程中有着极其重要的作用。我国疆域面积广阔,地域差异较大,在我国局部地区冬季昼夜温差较大,且冬季持