论文部分内容阅读
疾病是人类永恒的课题,疾病威胁着人类的健康。过去的几十年里,高通量实验技术的发展,使得我们能够在较短时间内获得大量的实验数据。这些高通量实验数据使得临床诊断、药物治疗效果预测等问题在分子层次上进行成为可能。研究者可以通过分析高通量实验数据理解疾病的机制,诊断疾病,预测药物治疗效果等,例如,利用不同病人的基因表达数据进行药物治疗效果预测等。
针对临床诊断,药物治疗效果预测,理解疾病机制等问题,本文开展若干高通量数据分析技术的研究,涉及生物标记物的发现方法,时序基因表达数据的分类方法,脂肪细胞特定蛋白相互作用网络的构造方法等。主要特色工作包括:(1)针对糖尿病诊断问题,基于局部统计的生物标记物提取方法发现了一种可以用来区分2型糖尿病患者和非患者的新型生物标记物,即胰蛋白酶消化的肽段,并验证了这些生物标记物在糖尿病诊断问题上的有效性。(2)针对药物治疗效果预测问题,提出了一种基于临床时序基因表达数据的融合网络先验知识的新分类方法,并将其应用到多发性硬化症病人药物治疗效果问题上。在2批独立的数据集上比较新提出的方法与现有的仅基于基因表达信息的方法的性能。(3)针对理解肥胖相关的疾病机制问题,利用一种局部共表达的算法构造了家鼠脂肪细胞分化过程中特定的蛋白相互作用网络,并讨论利用全局共表达算法构造的蛋白相互作用网络与利用局部共表达算法构造的蛋白相互作用网络的差异。