论文部分内容阅读
核受体(nuclear receptors,NRs)是配体依赖性转录因子,通过与配体结合而调控基因表达,它们是一类扩散并能与特异性配体结合的细胞内信号蛋白。核受体(NRs)对机体的生长发育、分化和新陈代谢等多种生理过程发挥重要功能。研究其功能和作用机制可以预防和控制许多疾病。 生物荧光蛋白(Bioluminescent Proteins,BLPs)是活的有机体,在不同的细胞过程中可发射生物荧光。它的发光原理被广泛应用在细胞内基因调控、监测和免疫。生物荧光蛋白的生物技术在医疗领域有很多应用。 本文所研究的核受体蛋白数据集和生物荧光蛋白数据集采用已发表文献中的可信数据集,选取氨基酸组分信息、二肽组分信息、伪氨基酸组分信息和物理化学特征组分并结合随机森林算法、支持向量机算法、加权K邻近算法,在5折交叉检验下分别进行预测。对核受体蛋白,采用两层分类器进行预测,第一层分类器预测是否为核受体蛋白,成功率达到96.84%,第二层分类器针对核受体蛋白的八种生物学功能进行分类预测,均取得了较高的预测成功率。在此基础上,选取各种特征参数对生物荧光蛋白数据集进行预测,当选用伪氨基酸组分信息作为特征向量结合支持向量机算法对生物荧光蛋白进行预测时,总体预测准确率最高为74.12%。