一般周期间隙约束的最长频繁模式长度的回归预测

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:sdg058229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一般周期间隙约束的序列模式挖掘是挖掘形如p1[M,N]p2[M,N]p3...pm-1[M,N]pm的频繁模式(M和N分别表示最小和最大间隙且M<0)。在挖掘一般周期间隙约束的序列模式时,合理的估算最长频繁模式的长度非常重要。估算的长度太长会消耗过多的内存,而长度太短会导致内存的溢出。本文旨在采用回归方法估算一般周期间隙约束下的最长频繁模式的长度。从三个方面进行研究和实现。一是特征提取,利用G-FSA算法(G-FSA是针对一般周期间隙的特征提取算法)计算所有长度为2的模式在DNA序列中的出现次数,从而得到实验所用数据集的前16维。二是获取回归目标,在DNA序列上利用MAPD-PRO算法(MAPD-PRO是一般周期间隙约束的序列模式挖掘算法)获得最长频繁模式的长度。改变间隙和阈值,得到不同间隙和阈值下的最长频繁模式的长度,从而获得数据集的第18维。第17维是序列模式挖掘的频繁模式阈值,通过这两个阶段可以得到实验所用数据集。三是利用回归方法构建学习机,本文采用了BP神经网络、最小二乘支持向量机(LS-SVM)和极限学习机(ELM)这三种回归算法。把前两个阶段获得实验数据集分为训练数据和测试数据,用三种回归方法训练数据,并用测试数据测试训练的效果。最后,本文设计了两组实验预测最长频繁模式的长度,一是阈值与间隙变化时,二是阈值与序列变化时。实验结果验证了使用回归方法预测最长频繁模式长度的有效性。
其他文献
采用物理模型试验方法研究海洋水动力学问题时,几乎均采用重力相似准则。这对于研究波浪和海流及其与结构物相互作用问题无疑是恰当的。但在重力相似体系下,研究风+波浪、或
沙波在大陆架地区被广泛发现和记载。沙波通过底部潮流作用,由泥沙的侵蚀、输运和沉积而形成。当地地形的变化,泥沙供给量、流体状态、全球温度变化以及海平面的水位高度都会
背景:前列腺癌在男性人群中是一种高发的恶性肿瘤,其危害性非常大。近些年来,随着医疗水平和科技发展水平不断提高,使前列腺癌的检出率明显上升,而且随着人均寿命的延长,前列腺癌的诊断率越来越高患,特别是早期前列腺癌患者诊断率明显提高。不过整体来看,我国晚期前列腺癌患者的数量仍然远高于早期筛查出的前列腺癌患者。目前前列腺癌的治疗方案包括内分泌治疗、腹腔镜下前列腺癌切除术以及机器人腹腔镜前列腺癌切除术等,这
海岸蕴藏着丰富的矿产资源,具有巨大的环境价值和经济价值。然而港口、河口、泻湖及海湾通海口严重的淤积问题会给海岸工程的建设带来较大影响,海平面上升以及各种人类活动的
近年来,随着陆地资源的过度消耗,人们开始加大对海洋资源的开采,因此在深海海底铺设了大量的油气输送管道。由于海洋环境的随机性和复杂性,海底管道在地震动作用下的动力响应
当前人们进入了信息化时代,移动通信和互联网在人们的生产和生活中越来越重要。信息化时代需要海量数据的支持,传统的关系型数据库已经逐渐不适应大数据量的存储和管理。在此
“转录组冲击”是指由杂交所诱导的基因表达发生快速遗传突变的现象,关于杂交过程诱导基因表达发生变化程度和变化模式的研究受到越来越多的关注。杂种劣势,与杂种优势相对应
水文模型是对现实世界中复杂水文过程的一种概化,模拟了降雨、汇流、蒸发等一系列水文现象。水文模型的研究是水文水资源科学研究领域中的重要部分,同时也是探究水文规律和模
研究区隧道具有地应力高的地域特点和埋深大的工程特点,施工过程中发生岩爆是该隧道在施工过程中所面临的主要工程地质问题和安全隐患之一,本文结合研究区隧道的工程地质环境和天然地应力场等实际情况,将岩爆预测研究作为本文的主线,对研究区该深埋特长隧道的岩爆问题进行了实例研究,本文的研究成果主要包括以下几个方面:(1)基于区域地质环境,尤其是大地构造格架、地质构造、地震,结合区域地应力场既有研究成果,分析了隧
21世纪是信息技术的时代,随着网络技术的提高,信息技术的发展,计算机科学的进步,信息技术渗透到人们生活中的各处角落,为人们的工作,学习,生活带来了巨大的便利。近年来,互联