Deep Discriminative Latent Space for Clustering 理解梳理

  • Post author:
  • Post category:其他


Deep Discriminative Latent Space for Clustering 理解梳理

翻译链接:

https://blog.csdn.net/shaodongheng/article/details/83021629

网络结构图:

两个部分的算法:

预训练阶段:



是最大迭代次数,
\lambda \in \left ( 0,1 \right ]

L_{d}^{i}
是第 i 次迭代方程:

的结果,
\epsilon
是一个很小的数。

计算数据集原始表示的k最近邻


A_{B}
是选择的锚对的集合,

表示该集合的样本数。


锚对:

将k-最近邻图

中具有最大相似性的一部分作为锚对。

设定

作为潜在空间的归一化的表示。

潜在表示矩阵

,其中
\left | B \right |
表示每一批次的样本数目,将
\tilde{Z}
定义为行归一化批量矩阵(其第i行是行向量
\tilde{z}_{i}^{T}
),并且将

定义为成对余弦相似度矩阵,使得

α<1是超参数。


最小化损失函数:

其中λ代表正则化强度,即系数,

表示重构损失,X代表原始输入批次的矩阵,
\left | \cdot \right |
代表Frobenius范数。


由此得到了预训练的自动编码器参数
\theta _{e}
和自动解码器参数
\theta _{d}

聚类阶段:


第一阶段:

优化过程从

的初始化开始,在整个数据集D上通过优化等式(7),即最大化:

得到初始化的

然后我们交替优化参数,即优化一个时其他保持不变,先最大化目标函数得到分配矩阵S,然后最大化得到

,最后最大化得到自动编码器参数。 优化过程迭代直到收敛。

将前面预训练阶段得到的模型参数

\theta _{e}

\theta _{d}

带入,

是聚类簇的质心,


S


是分配矩阵(权重矩阵)




是超参数

初始化


更新
\mu_{k}^{}


更新
\theta _{e}

\theta _{d}


第二阶段:

采用第一阶段得到的参数

初始化。

与第一阶段只是优化函数不同:

其中:



版权声明:本文为shaodongheng原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。