Deep Discriminative Latent Space for Clustering 理解梳理
翻译链接:
https://blog.csdn.net/shaodongheng/article/details/83021629
网络结构图:
两个部分的算法:
预训练阶段:
是最大迭代次数,
,
是第 i 次迭代方程:
的结果,
是一个很小的数。
计算数据集原始表示的k最近邻
,
是选择的锚对的集合,
表示该集合的样本数。
锚对:
将k-最近邻图
中具有最大相似性的一部分作为锚对。
设定
作为潜在空间的归一化的表示。
潜在表示矩阵
,其中
表示每一批次的样本数目,将
定义为行归一化批量矩阵(其第i行是行向量
),并且将
定义为成对余弦相似度矩阵,使得
。
α<1是超参数。
最小化损失函数:
其中λ代表正则化强度,即系数,
表示重构损失,X代表原始输入批次的矩阵,
代表Frobenius范数。
由此得到了预训练的自动编码器参数
和自动解码器参数
。
聚类阶段:
第一阶段:
优化过程从
的初始化开始,在整个数据集D上通过优化等式(7),即最大化:
得到初始化的
。
然后我们交替优化参数,即优化一个时其他保持不变,先最大化目标函数得到分配矩阵S,然后最大化得到
,最后最大化得到自动编码器参数。 优化过程迭代直到收敛。
将前面预训练阶段得到的模型参数
,
带入,
是聚类簇的质心,
S
是分配矩阵(权重矩阵)
,
。
是超参数
初始化
更新
:
更新
和
:
第二阶段:
采用第一阶段得到的参数
初始化。
与第一阶段只是优化函数不同:
其中: