基于改进MVO算法的DNA存储编码集合的约束与设计

来源 :大连大学 | 被引量 : 0次 | 上传用户:dluflonline
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术发展的同时也产生海量的数据,如何高效且低成本的存储数据成为一项难题。由于DNA具有高密度和耐久性的特点,DNA存储成为了一种可行的解决方案。DNA数据存储是将数据编码为DNA序列,再由DNA序列解码为数据的过程,是以DNA分子为信息载体进行数据存储的一种新型存储方式。DNA存储中数据的写入是将二进制信息通过编码规则转换成碱基序列,数据的读取由测序技术读取信息。目前国内外专家学者密切关注DNA存储的发展并且积极参与DNA存储的研究工作,相关技术已经从理论发展到生物实验阶段。DNA存储系统首先考虑的是DNA编码问题,DNA编码是将信息转换为DNA序列。高效的编码不仅有助于提高DNA存储的读写正确率,同时也有利于降低存储成本。为了构造有效的编码,在本文中基于物理和热力学性质提出了三种编码约束,并且对多元宇宙算法(MVO)提出了三种有效的改进,本文的工作如下:(1)为了构建DNA存储编码集合,提出了一种改进的KMVO(k-means多元宇宙算法)。MVO算法的理论基础来源于多元宇宙理论,由于在迭代前期收敛速度较慢,本文引入k-均值聚类算法(k-means)进行改进,并在13个测试函数上与MVO、GA、PSO等算法进行对比,在统计学结果(均值,标准差)上有显著提升。在此之后,加入DNA编码集合中相关约束,在给定的约束条件下分别构造对应的编码集合,并与前人的工作进行比较。KMVO算法比MVO算法构造的编码集合具有更好的边界。更大的DNA存储编码集合可以在给定长度上存储更多的有效信息,从而提高存储利用率。(2)针对在DNA存储的测序和合成过程中容易发生错误,提出了含有存储编辑距离约束和地址不相关约束的新组合约束,并且利用改进后的DMVO(Damp Multi-Verse Optimizer)算法构建满足组合约束的DNA编码集合,并利用这些码字作为非数据位。MVO算法的机理是通过黑/白洞进行物质的交换以达到稳定的状态,为了避免MVO算法陷入局部最优在算法中添加了阻尼因子作为扰动。DMVO算法得到的编码集合与前人的工作对比,构造了更高质量和大小的编码集合。较大的编码集合可以使用更短的地址位索引更多的数据,高质量的编码可以使DNA存储系统鲁棒性更强、更加稳定。(3)生化反应的进行伴随着热量的变化,所以热量的变化更能反映生化反应的本质。由此提出一种热力学MFE约束并且应用到DNA存储编码集的构建中,在这部分工作中使用了一种改进后的BMVO(Brownian Multi-Verse Optimizer)算法。为了降低MVO算法的初始化位置不佳的情况下,初始化值和最优值相差过多时对寻优的影响。在MVO算法中添加了布朗运动的更新方式,BMVO算法构建了更大的DNA存储编码集合。在集合大小,码率,热力学性质等方面与之前的工作进行了对比,BMVO算法构造的编码集合的结果都很有竞争力。构建更大的DNA编码集合可以降低DNA存储成本,构建质量更高的编码集合质量可以提高DNA存储系统的读写精度。
其他文献
学位
学位
学位
学位
学位
学位
学位
交通工具智能化是社会发展和科技发展的必然趋势,智能驾驶车辆的研究和普及能够极大地缓解因传统机动车辆数量急剧上升带来的一系列社会问题,比如车辆尾气造成的污染、道路扩张带来的土地资源紧张以及交通事故等。在自动驾驶研究领域中,由于强化学习善于解决序贯决策问题,备受自动驾驶研究人员的青睐。本课题专注于深度强化学习算法优化,并依托于智能驾驶任务予以验证和对比分析。针对深度强化学习需要大量的探索试错导致学习效
学位
环境气象与我们的生产和生活息息相关,气象在给我们带来便利的同时,也带了一些负面影响,如雷暴灾害。雷暴灾害作为对我们生活影响最广泛的气象灾害之一,时刻威胁着人们的生命和财产安全。因此,如何合理利用历史的雷暴灾害数据,来发现气象数据中蕴含的潜在信息,并根据合适的气象因子进行准确的雷灾预测已然成为科学研究的重点。目前,雷灾文本聚类方法仍然存在着由于聚类结果不可靠而导致无法从中挖掘出更深层次信息的问题;且