聚类

  • Post author:
  • Post category:其他




聚类

在这里插入图片描述

这是一组没有带类别标记的点,我们怎么才能把它划分成以下这种样子呢?

在这里插入图片描述

我们可以无监督学习的方法,无监督学习就是对无标记训练样本的学习,把样本分为几类,并作出标记。

聚类属于无监督学习,训练样本的标记信息是未知的,目的是通过对无标记训练样本的学习来揭示数据的内在性质及规律,然后对训练样本进行分类。

聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”。同一簇的样本尽可能彼此相似,不同的样本尽可能不同。换言之,聚类结果的“簇内相似度”高且“簇间相似度”低。

聚类性能度量大致分为两类。一类是将聚类结果与某个“参考模型”进行比较,称为“外部指标”;另一个是直接考察聚类结果而不利用任何参考模型,称为“内部指标”。

原型聚类亦称为“基于原型的聚类”。算法先对原型进行初始化,



版权声明:本文为weixin_43340018原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。