基于非时序观察数据的因果关系发现综述

来源 :计算机学报 | 被引量 : 0次 | 上传用户:ylm1982123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探索和发现事物间的因果关系是数据科学的一个核心问题,其中蕴含着丰富的科学发现机会和巨大的商业价值.基于非时序观察数据的因果关系发现方法能够从被动观察获得的数据中发现变量之间的因果关系,因而在各领域有广泛应用.这一类方法在过去三十年取得很大进展,已经成为因果关系发现的重要途径.文中从因果关系方向推断、高维数据上的误发现率控制和不完全观察数据上的隐变量检测这三个研究热点出发,对现有的因果关系模型与假设、基于约束的方法、基于因果函数模型的方法和混合型方法这三大类方法,验证与测评涉及的数据集及工具等方面进行了详尽的介绍与分析.基于约束的方法主要包括因果骨架学习和因果方向推断两个阶段:首先基于因果马尔可夫假设,采用条件独立性检验学习变量之间的因果骨架,然后基于奥卡姆剃刀准则利用V-结构确定因果方向,典型的算法有Peter-Clark算法、Inductive Causation等,这类方法的主要不足是存在部分无法判断的因果关系方向,即存在Markov等价类难题.基于因果函数模型的方法则基于数据的因果产生机制假设,在构建变量之间的因果函数模型的基础之上,基于噪声的非高斯性、原因变量与噪声的独立性、原因变量分布与因果函数梯度的独立性等因果假设推断变量之间的因果关系方向,典型的算法有针对线性非高斯无环数据的Linear NonGaussian Acyclic Model算法、针对后非线性数据的Post-NonLinear算法、适用于非线性或离散数据的Additive Noise Model等,这类方法的主要不足是需要较为严格的数据因果机制假设,且Additive Noise Model等方法主要适用于低维数据场景.混合型方法则希望充分发挥基于约束的方法和基于因果函数类方法的优势,分别采用基于约束的方法进行全局结构学习和基于因果函数模型进行局部结构学习和方向推断,典型的算法有SADA、MCDSL等,理论分析较为不足是这类方法目前遇到的主要困难.最后,文中还基于研究现状分析讨论了因果方向推断、高维数据上的误发现率控制、隐变量发现、与机器学习的关系等未来可能的研究方向.
其他文献
针对计算机与信息类专业大类招生及人才培养的教学客观需求,围绕面向计算机与信息大类招生培养的知识结构进行探讨.根据ACM、IEEE和我国教育部高等学校计算机科学与技术教学
提出了一种土坡抗震稳定性分析的新方法,即将有限元法和传统的滑动面法相结合.首先根据有限元法通过求解动力方程,计算出某一时刻土坡内的有效应力,然后根据有效应力计算该时刻的
多片元效果具有实时透明等重要应用,它需要每个像素按深度顺序遍历对应的所有片元.深度剥离法将场景重复绘制多次来满足这个需求,故对显存带宽提出了很高的要求.该文针对大规模场景图元分布稀疏的特点,使用类体素八叉树在物体空间将场景近似剖分以减少图元读取总量.这允许场景能够按可见性顺序被分块加载、精确剖分和逐个绘制:通过光栅化对应的八叉树网格构造深度桶列表,在屏幕空间将场景块与网格布尔求交;通过为整个场景构
介绍了基于GIS技术的“上海市防震减灾应急决策信息系统” .该系统由 7个功能模块组成 ,主要有 :地震地质基本信息、地震灾害快速评估子系统、地震应急决策信息子系统、信息查询、系统维护管理等 .介绍了彩红外航片遥感等软件应用技术 ,并提出此系统需改进之处