【摘 要】
:
随着测序技术的发展,生物大分子序列数据量也飞速增长。数据挖掘作为从庞大的数据中提取出未知、隐含及具备潜在价值的信息的技术,被广泛应用于生物信息领域,用于探索其生物意义。其中,三维基因组学是近些年来基因领域的研究热点,研究表明基因组的三维结构与基因的转录调控以及表观遗传存在相关性,然而物种间的基因组三维结构的比较分析尚未在植物中得到广泛研究。因此以杨树为例,使用数据挖掘技术对胡杨和新疆杨进行三维基因
论文部分内容阅读
随着测序技术的发展,生物大分子序列数据量也飞速增长。数据挖掘作为从庞大的数据中提取出未知、隐含及具备潜在价值的信息的技术,被广泛应用于生物信息领域,用于探索其生物意义。其中,三维基因组学是近些年来基因领域的研究热点,研究表明基因组的三维结构与基因的转录调控以及表观遗传存在相关性,然而物种间的基因组三维结构的比较分析尚未在植物中得到广泛研究。因此以杨树为例,使用数据挖掘技术对胡杨和新疆杨进行三维基因组比较分析,对于探索植物在进化过程中基因组空间结构的保守性及其对转录调控的影响具有重要意义。基于国内外现状调研,本文提出以下三个科学问题:(1)如何实现基于甲基化数据的染色质空间结构A/B compartments的分类算法?(2)以杨树为例,如何构建一个通用的植物三维基因组对比研究的分析流程?(3)如何构建一个在线的植物三维基因组对比分析平台?针对上述科学问题,本文采用数据挖掘技术展开研究,主要工作如下所述:(1)本文在A/B compartments分类算法pca.hic的基础上,结合相关性算法,实现了基于甲基化数据的A/B compartments分类算法,即MDPH(Methylation data based pca.hic)。MDPH直接利用能够动态反映染色质状态的甲基化数据来对A/B compartments分类,从而提供比基于静态基因数据的pca.hic算法更准确的A/B compartments结果。(2)本文结合基因组三维结构鉴别软件、MDPH算法、区间重叠算法和数据挖掘等计算机手段对胡杨和新疆杨的三维基因组进行了对比分析,提出了一个通用的研究植物近缘物种之间三维基因组的对比分析流程。该研究方法量化了在植物进化过程中染色质三维结构的变化对表观遗传的影响,对研究人员存在一定的借鉴意义,可以加速人们对植物之间的三维基因组对比分析的研究进度。(3)本文基于Web开发技术和Django框架,建立了一个针对植物的三维基因组对比分析的在线数据计算平台,即TPGCA(Three dimensional Plant Genome Comparative Analysis Platform)。TPGCA平台实现了基因组三维结构鉴别、基因组三维结构可视化和基因组三维结构对比分析等功能,为研究三维基因组对比分析的研究人员提供了方便简单的数据处理服务。
其他文献
图像分割是计算机视觉领域中一个非常重要的研究课题。图像分割通常用于定位图像中的物体和边界,其目的是简化或改变图像的表示形式,使得图像更容易理解和分析,在目标识别、运动物体跟踪、生物医学图像分析等领域中都有广泛的运用。图像分割的一个核心挑战是由成像设备、照明条件和复杂背景引起的图像灰度不均匀性。虽然目前已有的算法可以很好地分割出灰度均匀图像中的目标物体,但是对灰度不均匀场景则会出现较大误差。由于灰度
循证医学是一种遵循证据的医学实践方式,要求医学从业者慎重、准确且明智地应用当前最好的研究证据来制定患者的治疗方案。在循证医学中,常使用PICO框架描述临床问题。PICO框架将临床问题分解为四个元素:参与者/问题(Population/Problem,P)、干预(Intervention,I)、比较(Construction,C)和结果(Outcome,O)。医学从业者为临床问题筛选研究证据时,希望
随着信息技术的不断普及,越来越多的案件需要使用到电子证据,从网络诽谤到电信诈骗等,电子证据成为破解此类案件的关键。然而电子证据极具脆弱性,十分容易被损坏。传统的电子证据存取证系统存在中心化存储、数据流向不透明、自动化程度不高等问题。并且普通大众缺乏举证能力,遭遇侵权时往往不知如何存证、取证,因为不规范的证据保全可能会导致证据失去法律效力。区块链技术具备数据不可更改、多方维护等特点,有效地解决了电子
阴影技术作为重要的渲染技术之一,在帮助人们理解三维空间中物体的几何形状、大小、及相对位置起着至关重要的作用。由于符号距离场具有能够表达三维空间场景信息的特点被广泛应用于渲染高质量的软阴影效果。然而,现有利用符号距离场进行软阴影渲染的算法由于遮挡率估计不准确,造成半影收缩等问题。针对该问题,在充分研究一阶符号距离场特点的基础上,本文提出了一种基于一阶符号距离场的软阴影改进算法。其基本思想是,通过一阶
随着工业大数据规模的不断扩张,面向工业场景下的大数据智能分析应用逐渐兴起。但在实际应用中,工业数据存在规模量大、分布不集中、结构复杂且类型多样的问题,且由于企业数据分布不均和数据管理能力不佳等因素,使企业在进行所需的数据分析时受到阻碍。因此,如何进一步挖掘工业数据价值成为关注焦点。通过构建数据共享(Data Sharing,DS)平台,加强优势企业的合作和数据开放,可以有效解决企业间的数据孤岛问题
人脸识别技术是计算机视觉领域的一个重要研究方向,有着无接触性、信息采集成本低、自动化程度高等优势,在越来越多的实际场景中都得到了应用。目前为止对于限制场景下的人脸识别技术已经较为成熟,但是对于非限制场景下的人脸识别仍然是一项挑战。其中,复杂的光照条件使得人脸图像出现大范围阴影,图像质量变差;图像中的人脸存在平面旋转、位置偏移、小幅度姿态变化引起识别精度降低;如何全面地利用人脸图像的信息将多种特征进
立体视觉是通过模拟人类的双目视觉,获取环境深度信息的任务,它的原理主要是通过计算成像和数学建模预测物体在三维空间中的深度,以达到还原场景三维信息的目的。立体视觉作为计算机视觉当下最为火热的研究方向之一,被广泛应用在自动驾驶、虚拟现实、增强现实、三维测量与三维重建等热门领域。在计算机立体视觉中,最为常用的方法是双目立体视觉。双目立体视觉的难点在于如何正确建立双目图像之间所有像素的一对一的映射关系。因
精准农业以物联网为基础,通过部署传感器和研究人工智能技术来控制果实/农作物的生产过程,主要包括:农业产量估测、农作物智能化病害检测以及生长过程品质监控等,以更低的成本提升果实产量等级,经济效益更大化。当前,针对葡萄视觉产量预估的工作主要是从基于检测的葡萄串检测和基于回归的葡萄颗粒计数这两个方面进行开展的。然而,这两类方法相对独立,且覆盖场景有限,并伴随着较大的产量预估误差。对此,提出了串-粒融合的
近年来,随着监控摄像头的普及和城市安防的需要,行人重识别成为了计算机视觉领域越来越重要研究的课题。其潜在的应用领域也越来越宽广,在刑侦破案、智慧城市、无人超市等领域有着广泛的应用前景。早期的行人重识别技术是通过手工提取行人图像的特征,如今基于深度学习的方法在行人重识别技术上应用已成为研究的热点。针对行人重识别,相关研究者已经做了很多的工作,然而依然存在一些需要解决的问题。一方面行人重识别数据采集困
随着现代计算机视觉的不断进步和发展,三维重建技术引起了学术界和产业界的广泛关注,在模型缺陷检测、智能机器人视觉、3D打印等领域有着非常广泛的应用,尤其是对室内场景进行实时稠密的高质量的三维重建是机器人、增强现实等领域关注的重点。三维重建算法可大致分为双目立体视觉的三维重建和基于RGB-D传感器的实时三维重建。基于双目立体视觉的三维重建,一般是通过多个视角的观察数据帧和帧间的视差信息来计算出物体的深