论文部分内容阅读
在很多应用中需要度量不同物体之间的相似性。在某些特定领域中已经有一些方法来度量这种相似性,比如用文本的匹配度度量文档的相似性,用交集度量两个集合的相似性。我们提出了一种基于关系网的相似度学习算法,称为SimpleSim。SimpleSim算法根据无向关系图的邻接关系计算节点之间的相似度。“两个对象是相似的如果它们与相似的对象有关系。”
低维表示常用于其它机器学习算法的数据预处理过程,它能压缩数据的存储量,凸显数据的特征信息,使得后续的诸如回归、分类等算法更准确容易的实现。我们提出了一种基于相似性度量的数据低维表示方法,SBLR。该方法在给出部分对象之间的相似性度量后计算一个符合相似性的低维表示。
实验表明用SimpleSim学习的相似度在一个基于相似性的分类器上有很好的效果,并展示了结合SimpleSim和SBLR对图的低维表示效果。