之相专题

Python机器学习之相异性度量

1 引言 相似性和相异性是机器学习中重要的概念,因为它们被许多数据挖掘技术所采用,比如常见的聚类、最近邻分类和异常检测等。在很多情况下,一旦我们计算出了特征向量的相似性或相异性,我们就不在需要原始数据了。这类方法通常将数据变换到相似性(相异性)空间,然后在做数据分析。 2 定义 相似度(similarity): 两个对象相似程度的数值度量,两个对象越相似,它们的相似度越高;通常取值为非负的,