层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。
k-means聚类对于下面这种文章略显鸡肋
这种情况考虑用层次聚类发法就比较好了。
程序相关的数据下载:链接:https://pan.baidu.com/s/1dGiiUgp 密码:sikz
matlab源码如下:
% 载入数据
load('data.mat');
Data = [X(:) Y(:)];
% 计算前边点与后边点距离
disVector = pdist(Data); % pdist之后的Y是一个行向量,15个元素分别代表X 的第1点与2-6点、第2点与3-6点,......这样的距离
% 转换成方阵
disMatrix = squareform(disVector);
% 确定层次聚类树
treeCluster = linkage(disMatrix);
% 可视化聚类树
% dendrogram(treeCluster);
% 聚类下标
idx = cluster(treeCluster,'maxclust',3); %划分聚类为3类
% 画图
figure
axis equal
hold on;
% 不同类按照不同颜色绘制出来
for i = 1:1600
switch(idx(i))
case 1
scatter(X(i),Y(i),'r');
case 2
scatter(X(i),Y(i),'g');
case 3
scatter(X(i),Y(i),'b');
otherwise;
end
end
运行结果:
版权声明:本文为Tan_HandSome原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。