余弦相似度和范数

  • Post author:
  • Post category:其他

余弦相似度

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫”余弦相似性”。
公式推导如下:a,b两个二维向量在坐标系中的表示如下。
在这里插入图片描述
通过余弦定理公式推导出余弦相似度公式。
在这里插入图片描述

范数

上图结果中字母的||*||符号是范数的表示符号。
范数(Norm)是一种关于向量的函数,是向量“长度”概念及其推广。在线性代数、泛函分析及相关的数学领域,可用范数来度量一个向量的“长度”。在中学里我们学过一个向量的模长(长度)是向量中各元素平方和的平方根,比如向量(3,4)的模长就是5,这里模长其实是向量(3,4)的一种范数——L2范数,向量的范数除了L2范数外,还有其他定义,如L0范数、L1范数和L∞范数。

  1. 若向量X = (x1, x2, …, xn),则向量X的L0范数为
    在这里插入图片描述
    若向量A = (0, 3, 6),向量A中有1个元素为0,2个非零元素 (3和6),则A对应L0范数为
    在这里插入图片描述
  2. 若向量X = (x1, x2, …, xn),则向量X的L1范数为
    在这里插入图片描述
    若向量A = (0, 3, 6),则A对应L1范数为
    在这里插入图片描述
  3. 若向量X = (x1, x2, …, xn),则向量X的L2范数为
    在这里插入图片描述
    若向量A = (2, 3, 6),则A对应L2范数为
    在这里插入图片描述
  4. 若向量X = (x1, x2, …, xn),则向量X的L∞范数为
    在这里插入图片描述
    若向量A = (2, 3, 6),则A对应L∞范数为
    在这里插入图片描述