论文部分内容阅读
溶液核磁共振技术是在生理状态下研究蛋白质结构、相互作用以及动力学性质的重要手段之一。蛋白质主链或者侧链甲基的核磁共振信号认证(又称信号指认或者信号归属)是溶液核磁共振技术进行这些研究的第一步,通常也是最难的步骤。蛋白质的主链核磁共振信号能提供数量庞大的核磁共振探针,但是这种信号的灵敏度会随着蛋白质分子量的增大而迅速衰减,而侧链甲基的核磁共振信号数目虽然不及主链,甲基优秀的横向弛豫性质使其即使在超大蛋白质体系中也仍旧能通过核磁共振技术检测到。因此,对蛋白质的主链以及甲基核磁共振信号进行认证,能提供不同数量的,不同分子尺度下的氨基酸层面的结构、相互作用以及动力学信息。对于分子量大于30kDa的蛋白质,由于13Cβ原子的快速横向弛豫以及13Cα原子的的化学位移高度简并,即使结合全氘代、横向弛豫优化实验等众多用来减小横向弛豫速率的核磁共振技术,也很难对主链进行高完成度、高准确率的认证。虽然目前能进行蛋白质甲基核磁共振认证的方法有很多,但是这些方法都有一定的局限性,尤其是对于分子量在30kDa-50kDa的蛋白质,目前没有哪种通用的认证方法能单独地、高完成度地、高准确率地、高效地去进行甲基认证。对此,我们提出了一种协方差LCC的认证方法,这种方法仅仅只需要一个蛋白质样品就能高完成度、高准确率、高效地同时完成主链以及甲基的核磁共振信号认证。这种协方差LCC的方法选取了灵敏度最高的主链核磁共振谱图HN(CO)CA&HNCA 以及甲基核磁共振谱图 CA-TOCSY-(CM)HM&methyl-HMQC作为原始谱图,因此从很大程度上缓解了蛋白质分子量增大带来的信号衰减问题。通过沿着贡献维度13Cα、13Cα、1HM分别构造HN(CO)CA与HNCA、HNCA 与 CA-TOCSY-(CM)HM、CA-TOCSY-(CM)HM 与 methyl-HMQC 的协方差谱图,协方差LCC的方法巧妙的将传统的主链或者甲基认证方法中,利用这些谱图对之间的13Cα、13Cα或者1HM化学位移进行匹配认证时遇到的多重认证问题转化为了协方差谱图中伪峰识别的问题。我们将峰形线性相关系数(LCC)作为伪峰筛选的标准,这种LCC筛选标准能过滤近90%的协方差谱图中的伪峰,这意味着通过这种协方差LCC的方法能解决近90%的多重认证问题。我们在Matlab上构建了利用这种协方差LCC的方法进行主链以及甲基认证的算法,并利用其高完成度、高准确率地认证了 306.6KU-[2H,13C,15N]-MBP、302.6K U-[1H,13(C,15N]-TRIM66蛋白质的主链核磁共振信号以及306.6K U-[2H,13C,15N]-[1(δ1 only)]-MBP、283.6KU-[2H,13C,15N]-[1(81 only),LproR,VproR]-MBP蛋白质的甲基核磁共振信号。