SVM几何修正法及其在DNA序列处理中的应用

来源 :北京工业大学 | 被引量 : 6次 | 上传用户:noegen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支撑向量机(SVM)是一种模式识别技术,相当于一种模式分类器。SVM是参数空间的一种线性分类器,但它可以通过核函数扩展成非线性分类器,因此SVM的性能在很大程度上依赖于核函数的选择。但是目前对特定数据集,还没有一个好的选择核函数的方法。J.C.Burges在他1999年发表的一篇文章中用信息几何的观点赋予了核函数几何性质。根据他的结果,Amari在同年提出了一种利用核函数的几何性质对其进行修正的方法,以提高SVM的分辨率。 本文运用信息几何方法和修正核函数思想,提出了一种SVM几何修正法。该方法用双曲正割函数构造拟共形变换函数,对多项式核函数进行修正来提高SVM的分辨率,并侧重于拟共形变换函数中的参数分析,确定了参数的取值方法,缩小了参数选取的范围。在人工数据和DNA数据的分类实验中,修正后的SVM具有更高的分辨率,这说明了本文提出的SVM几何修正法和参数选取的方法的有效性。 另一方面,随着基因组信息的不断出现,需要分析大量DNA数据。DNA序列处理一般是先寻找一种数学表示,再借助其它工具对其进行分析。本文在DNA序列CGR图表示的基础上,利用CGR图具有的可视特征,将其转化为多维向量,并用SVM方法和SVM几何修正法,分别进行了外显子与内含子以及外显子与整个基因的分类实验,得到了很高的分辨率。这表明本文提出的DNA序列的向量表示法对于区分外显子与内含子或区分外显子与整个基因是有效的。
其他文献
需求不确定性是消费者的能动因素造成的,只能通过技术手段化解。利用大数据技术,可以有效识别消费者需求信息,消除需求不确定,增加潜在消费者。但在采购大数据技术服务的过程中,低效问题普遍存在,这就需要有效的协调机制以确保参与约束与激励相容的实现。研究通过构建零售商、制造商、大数据服务商三级供应链博弈模型,得出以下结论:无论分散决策还是集中决策,采购大数据服务后供应链收益高于采购前整体收益。分散决策时供应
商博良曾说:"生活的真谛在于热情。"他的一生就是这句话的写照。在大英博物馆4号展厅里,真正的"流量明星"不是那一座座造型精美的埃及雕塑,而是馆藏编号EA24的一段黑色花岗岩断碑。这就是大名鼎鼎的罗塞塔碑(Rosette Stone,由于音译,也称罗塞达碑),高112.3厘米,宽75.7厘米,
期刊
以跨行政区域线状分布且多与自然资源相伴而生的红色旅游资源为切入点,针对区域红色旅游与国土空间规划拟合错位、红色旅游与三条控制线相互交织等问题,围绕国土空间规划层级传导和冲突协调展开探讨:以纵横传导双向引擎的方式构建分层次有传导的红色旅游空间体系,从而打破红色旅游区域协调和用地管制的问题;科学合理地协调红色旅游与三条控制线的冲突,当红色旅游与生态保护红线和永久基本农田红线冲突时应强调在保护中发展,在
代数的Hochschild同调和上同调的研究始于G.Hochschild于1945年的文献。2000年,C.C.Xi研究了具有同调理想的代数的Hochschild上同调,并证明了若Φ:A→B是同调满射,我们可以用一个长正合列将Hi(A)和Hi(B)联系起来。本文中,我们首先就一类特殊的同调理想-遗传理想J进行了研究,给出了A和B在次数大于1时其Hochschild同调相等的证明,对于其一次和0次H
为了解决电子发射体(阴极)研究方法中存在的问题,并寻求一种适当的、方便的阴极研究实验方法,本论文论证了建立与AES相连的PLD装置的必要性和可行性,并实际建立了这一装置,实现了阴极的原位沉积、原位分析。 电子发射现象是在电子发射体表面发生的物理过程,发射表面是由活性元素构成的动态平衡系统,这一系统直接决定电子发射性能。表面分析手段对阴极研究是必不可少的。PLD是制备薄膜的最好方法之一,PLD
糖尿病肾脏病(DKD)是我国慢性肾脏病的主要原因之一,给社会公共卫生和患者的生存质量造成了巨大的影响。最近颁布的多项指南更新了有关DKD治疗与管理的建议,新型降糖药物为DKD的防治提供了新的选择。中医药干预DKD历史悠久,相关理论不断发展和完善。随着循证医学在中医药研究中的应用和增加,中医药干预DKD在缓解患者乏力、水肿、腰酸等症状,减少尿蛋白水平和保护肾功能,提高治疗有效率,降低终末期肾脏病的发
在社会经济发展水平进一步提升的基础上,人力资源开始得到更多公司的关注和青睐。人力资源共享服务是一类创新理念,也被当作一种新的人力资源管理模式。其作为一个独立运行的运营模式,对于国家以及企业来说自然有着十分重要的作用。以此作为基础,能够发现人力资源在整个社会运营过程中,尤其是对于企业的发展来讲是非常重要的。文章就此针对集团公司人力资源共享中心模式进行探讨,希望能够为相关集团公司的人力资源共享服务发展
Panel数据模型是一类具有重要应用的线性统计模型,它在经济、金融、生物、医学等领域都有广泛的应用。近二十余年来,关于这种模型的统计推断吸引了很多统计学家。本文首先概述了这一领域参数估计方面的最新发展,然后集中讨论了既含有个体效应,又有时间效应的Panel数据模型的参数估计。许多文献研究了两者都是随机效应情形时回归系数的参数估计。但是,在一些情况下,假定其中之一是固定效应较为合理。本文正是基于这种
学位
航空公司的运输业务90%通过代理人销售,代理人和航空公司的销售款结算大多为周期结算,此模式导致航空公司面临一定的应收账款风险。应收账款是航空公司财务管理的难点,如何按时收回应收账款,提高应收账款周转率,在确保应收账款按时回收的同时,最大限度地促进营销,本文就此问题进行了探讨。