高维局部共表达模式挖掘算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yulei000111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
With the development in DNA microarray technology, expression values of thousands of genes can be simultaneously measured efficiently in biological process. Co-expressed gene patterns are essential in revealing gene functions, gene regulations, subtypes of cells, and cellular processes of gene regulatory networks. However, many co-expressed patterns are similar in a group of genes only under specific experimental conditions. In this thesis, we mainly focus on two kinds of localized co-expressed gene patterns: co-attribute pattern and co-tendency pattern.For co-attribute pattern, most of current algorithms are for 2D and 3D datasets. The existing high dimensional frequent closed pattern (FCP) mining algorithm is not very efficiency, especially on dense data. We proposed a high dimensional FCP mining algorithm HDminer. It is based on space partition and inherently has better performance than algorithms based on enumeration tree, especially on dense datasets. We conducted experiments on real gene expression data and synthetic data to show its efficiency and scalability.As to co-tendency pattern, we proposed the first high dimensional localized clustering algorithm, HHLC. It uses hierarchical scheme and facilitates a progressive refinement of results. We conducted an experiment on Arabidopsis gene expression data. We studied the parameters of HHLC and the result indicates our algorithm can find clusters with significant biology interests.
其他文献
当前,科技信息领域的现状是:各省级科技情报单位收集了大量区域内的科技信息资源并建立了各自的信息系统。随着我国“科教兴国”战略的推进,对科技资源的信息化建设也提出了
身份认证是计算机和互联网世界里最基本的要素之一,也是整个信息安全体系的基础。生物识别技术应用于身份认证是未来发展的趋势,相对于基于口令和智能卡的技术来说,生物识别
医院信息系统的迅速普及,为医疗行业积累了海量有价值数据。对这些数据的有效利用、分析,挖掘其中隐含的信息、知识及模式,可为疾病患者提供更好的诊疗及保健,为管理者提供更好的
我国社会经济的高速发展离不开日益发达的道路交通运输,发达、快速的道路交通运输已经成为经济发展的必备条件。同时,随着人们的购买能力的增强,私家车的数量大幅上升,密集的道路
随着多媒体技术和网络技术的不断发展,多媒体信息的数量迅猛增长,为了充分利用已有的多媒体资源,研究多媒体检索技术变得越来越重要。音乐检索技术研究的是如何从大量音频信
AVS是我国自主创新战略的一个典型。从2002年开始,以AVS标准工作组的方式,组织了国内外两百多家单位、一千多人的队伍开展联合创新,制定了配套的数字音视频信源编码标准,成为
随着互联网的飞速发展,人们利用互联网共享各种信息,使得网络信息资源日趋丰富,搜索引擎正是为了解决这一问题而发展起来的,而现在的搜索引擎存在明显的缺陷:一是搜索引擎结
随着互联网的快速发展与Web 2.0时代的到来,在线新闻作为主要的网络信息载体,已经成为人们获取新闻资讯的主要渠道。其内容与形式也不断创新,允许用户通过情绪投票直接抒发自
调度的根源在于对资源的争用和分配,无线领域的分组调度主要是要保证用户业务的服务质量和各个业务流之间享受服务的公平性。高速上行分组接入(HSUPA)是第三代通讯伙伴计划(3
短信息以其移动性好,收发便捷,内容丰富等特点,受到广大移动通信用户的普遍青睐,特别是青少年手机用户,往往把收发短信作为信息交互,感情沟通和互动娱乐的主要方式之一。然而