论文部分内容阅读
【目的】比较不同监督聚类方法的优劣及其适用场合。【方法】应用2种高斯混合模型聚类法(GMM)、K-最近邻居法(KNN)、二分类支持向量机器法(SVMs)以及5种多分类支持向量机器法(MC-SVMs),分别对计算机模拟数据以及两组实际微阵列数据进行聚类分析,采用假阳性(FP)、假阴性(FN)、聚类的准确性以及马修斯相关系数(MCC)等指标进行评价。【结果】(1)对成千上万基因表达谱数据,在服从高斯分布条件下,2种GMM法聚类准确性最高,且在训练样本容量较小的情况下,GMM-II法聚类准确性优于GMM-I法。