相似度计算——欧氏距离、汉明距离、余弦相似度

  • Post author:
  • Post category:其他

计算图像间的相似性可以使用欧氏距离、余弦相似度/作为度量,前者强调点的思想,后者注重线的思想。

欧氏距离

欧式距离/Euclidean Distance即n维空间中两个点之间的实际距离。已知两个点
A=(a1,a2,...an),B=(b1,b2,...,bn)

A

=

(

a

1

,

a

2

,

.

.

.

a

n

)

,

B

=

(

b

1

,

b

2

,

.

.

.

,

b

n

)

,则AB间的距离为:

d(A,B)=[(aibi)2](i=1,2,...,n)

d

(

A

,

B

)

=

[

(

a

i

b

i

)

2

]

(

i

=

1

,

2

,

.

.

.

,

n

)


同样可以利用欧式距离计算图像的相似度,欧式距离越小相似度越大。

计算欧氏距离:

double euclidean_distance(Mat baseImg, Mat targetImg)
{
    double sumDescriptor = 0;
    for (int i = 0; i < baseImg.cols; i++)
    {
        double numBase = abs(baseImg.at<float>(0, i));
        double numTarget = abs(targetImg.at<float>(0, i));
        sumDescriptor += pow(numBase-numTarget, 2);
    }
    double simility = sqrt(sumDescriptor);
    return simility;
}

汉明距离

汉明距离/Hamming Distance也能用来计算两个向量的相似度;即通过比较向量每一位是否相同,若不同则汉明距离加1,这样得到汉明距离。向量相似度越高,对应的汉明距离越小。如10001001和10110001有3位不同。

余弦相似度

余弦相似度是利用两个向量之间的夹角的余弦值来衡量两个向量之间的余弦相似度。两个向量越相似夹角越小,余弦值越接近1。
在n维空间中,对于向量
A=(a1,a2,...an),B=(b1,b2,...,bn)

A

=

(

a

1

,

a

2

,

.

.

.

a

n

)

,

B

=

(

b

1

,

b

2

,

.

.

.

,

b

n

)

,其余弦值为:

cosθ=n1(ai×bi)n1a2i×n1b2i

c

o

s

θ

=

1

n

(

a

i

×

b

i

)

1

n

a

i

2

×

1

n

b

i

2


double cos_distance(Mat baseImg, Mat targetImg)
{
    double squSumB = 0;
    double squSumT = 0;
    double innerPro = 0;
    for (int i = 0; i < baseImg.cols; i++)
    {
        double numBase = abs(baseImg.at<float>(0, i));
        double numTarget = abs(targetImg.at<float>(0, i));
        squSumB = squSumB + numBase*numBase;
        squSumT = squSumT + numTarget*numTarget;

        innerPro = innerPro + numBase*numTarget;
    }
    double modB = sqrt(squSumB);
    double modT = sqrt(squSumT);
    double simility = innerPro / (modB*modT);
    return simility;
}

版权声明:本文为akadiao原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。