论文部分内容阅读
距离度量学习是机器学习领域较为活跃的研究课题之一,文中利用UCI(加州大学欧文分校)数据库的数据对度量学习算法进行比较研究。为了寻找一种可靠的没有明确定义标志的算法,选择四种算法在UCI的六个数据集上对距离矩阵进行比较。每个样本数据集的性质(尺寸和维度)是不同的,因此算法的结果也不同。编码相似度算法在大多数情况下表现良好。在未来的实际应用领域,对于提高无标记数据和相似集的距离度量学习算法的精确性提供了研究基础。