算法核心步骤:
K-means聚类的方法也叫K均值聚类,聚类的方法有许多中,其中K-mens可能是最常用到的方法。
1 算法的优缺点:
优点 缺点
使用简单 因为它使用了一个随机的元素,所以它不能保证找到最佳的类
无 需要一个合理初始化要聚类的个数:即要初始化K
2.算法的核心思想:物以类聚、人以群分。
K-means算法的核心思想主要是:假设数据的记录是N,该算法首先任意选择K个聚类中心点,那么其它的(N-K)个记录中每一条记录,计算出到初始化的K个记录的距离(其它距离函数也可以)并比较其大小,选择最小的距离。
然后,剩余的(N-K)条记录,都能找到自己的“家”,形成了初步的K类。
进一步,对上一步聚成K类的数据,计算其每一类的均值,形成新的K个中心点
循环,所有的N个记录从新开始找“家”,按照距离最近的方法,
结束,当K个中心点变化不大,或者每次每家的成员固定不变时候,算法结束。
版权声明:本文为a2011480169原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。