基因序列图形表达及聚类分析应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lhnyzz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学和医学的迅速发展,以及各种生物的基因和蛋白质的研究,产生了越来越多的庞大的生物基因序列数据通过分析这些序列数据可以获得对人类有益的有关生物结构和功能的信息。数据挖掘技术尤其是聚类分析技术是基因序列分析的一种重要的手段,本文着重研究基因序列图形表达和基于图形表达的基因序列的聚类技术分析与应用。本文提出了一种基于生物学特征的非退化3-D图形表达方法,利用此图形表达来表征基因序列不仅使原始序列的生物学特征得以保留,而且还克服了图形的非退化现象。在建立基因序列矩阵过程中引入了几何中心,采用矩阵的最大特征值不变量来表征原始基因序列。在基因序列图形表达数据聚类分析中,本文提出一种基于多维伪F统计量的动态模糊K-均值聚类分析方法。该聚类分析方法能保证最终类内散步矩阵之迹达到最小,把多维空间的数据有效的分为具有特定数目的不同的类,给出最佳聚类个数。利用文中基因序列图形表达建立H5N1病毒基因序列图形表达数据对本文聚类分析方法进行验证,结果表明该聚类分析方法具有较好的合理性。在BIRCH聚类算法分析研究中,详细分析讨论了BIRCH算法中存在的不足,并针对其不足进行一定的改进,提出了一种基于离差平方和的改进多阀值BIRCH算法,充分利用离差平方和来建立簇与簇的相关性,相对于单纯以簇之间的中心距离来建立相关性有一定的改进,同时在分裂因子的确定上采用了簇中直径的最大值,克服因采用经验值确定分裂因子的缺陷。最后,引入到基因序列图形表达数据聚类分析应用中。
其他文献
Cu-Cr-Zr系合金是一类具有综合物理性能和力学性能的结构功能材料,具有很高的强度、良好的导电导热性能和抗腐蚀性能,广泛应用于核装备、大型集成电路引线框架、高速铁路用接
本文研究了以氧化铝、氢氧化铝、勃姆石为铝源的金属有机框架MIL-53(Al)的优化合成。结果表明,采用水不溶性金属源成功合成金属有机框架材料MIL-53(Al)的同时可对产物的孔道
最近几年来,由于国家教育部多次发文强调了书法教学的重要性,规定书法教育是义务教育这个阶段的基本教学内容之一,要求全国中小学加强书法教学,结合笔者曾经在山西省太原市松
《区域全面经济伙伴关系协定》(RCEP)由东盟十国、中国、印度、日本、韩国、澳大利亚、新西兰16个国家组成,目标是最终达成一个全面、高质量、互惠的自贸协定,这与“和平合作、开放包容、互学互鉴、互利共赢”的丝路精神高度契合。入世18年以来,中国履行了降低农产品关税以及取消数量配额、许可证等非关税措施等重大承诺,已发展成世界最大的农产品进口国、第六大农产品出口国,农产品贸易总额位居世界第二,但对外开放
中新世作为新生代全球气候由暖转冷的关键时期,期间大陆漂移、造山运动以及其他构造活动盛行。南海位于欧亚大陆和热带西太平洋之间,由于特殊的地理位置,使得其对全球气候和
压缩机的涡旋动静盘是汽车空调工作的最核心部件之一,为了更高效更稳定的对该零部件进行批量机械加工,需要设计一套精密的专用工装,本论文对最终研发成功的半自动化精密专用
本文在分析信息化和工业化深度融合与企业技术创新之间作用关系的基础上,从创新投入、过程、效率和产出效益等系统要素出发,构建了两化深度融合推动企业技术创新的因果关系图
自然水体是包括水相和沉积物、悬浮物以及生物体等多种固相物质的复杂体系。颤蚓作为典型的底栖生物,其在沉积物表面的代谢和扰动作用产生的物质交换与迁移增大了水环境体系的复杂性与动态性。为探究颤蚓扰动对于重金属在多相共存的水环境体系中的迁移和固定的长期影响过程,本研究利用微宇宙模拟自然水体的方法,研究在不同生物量的颤蚓扰动影响下,自然水体内源释放和外源加入的重金属Cu和Cd在包括沉积物、生物膜和悬浮颗粒物
我国果蔬采后损失率超过30%,远高于发达国家的平均水平,因此,生鲜果蔬的贮运保鲜技术已成为我国农产品加工贮运中迫切需要解决的关键技术难题。平衡气调包装技术可通过调节贮
目的:ICU住院患者急性肾损伤(AKI)发生率为15%~20%,病死率为11.0%,AKI除了可以增加患者住院时间、住院花费和死亡率,还可以增加后期慢性肾脏病(CKD)的发生以及远期死亡风险。