Gephi快速入门
Gephi被称为“数据可视化领域的Photoshop”,是一款开源免费跨平台基于JVM的复杂网络分析软件,主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
本文参考Gephi官网的
入门手册
,介绍Gephi的基本使用。
Gephi版本:0.10。
数据集:LesMiserables.gexf(维克多雨果的《悲惨世界》)
1. 导入文件(Import file)
点击
File-Open
打开文件LesMiserables.gexf后显示:
- Number of nodes
- Number of edges
- Type of graph
点击
ok
,显示图像如下(由于节点开始时随机分布的,因此图像会略有不同)。
使用鼠标滚轮调整图形大小
使用鼠标右键调整图形位置
使用底部的滑块调整线条和箭头的粗细
使用放大镜重置位置
2. 布局(Layout)
Gephi的核心就是通过布局算法确定图形布局,默认提供12种布局,详见
Gehpi的网络布局
。
使用左侧面板的
Layout
模块,选择
Force Altas
,设置
Repulsion strength
(斥力)为10000。
点击
run
启动算法,点击
stop
停止算法,显示图形如下:
3. 排序(Ranking)
排序是根据节点的指标和标签对其进行排序和归类,并以大小、颜色的形式应用到节点上。
选择
Nodes-Ranking-Degree
点击
Apply
4. 指标(Metrics)
可计算的指标包括:
- 图直径(Diameter)
- 平均路径长度(Average Path Length):网络中任意两个节点之间的距离的平均值
- 聚类系数(Clustering Coefficient):衡量节点聚集的程度
- PageRank
- HITS
- 介数中心性(Betweeness Centrality)
- 接近中心性(Closeness Centrality)
- 离心率(Eccentricity)
- 社区发现(Community Detection)
计算网络的平均路径长度(average path length):选择右侧面板的
Statistics
模块,选择
Avg. Path Length
,点击
run
。
选择
Directed
,点击
OK
计算指标。
显示结果如下:
通过计算平均路径长度可得到以下三个值:
- Betweeness Centrality
- Closeness Centrality
- Eccentricity
返回
Ranking
模块,在列表中选择
Degree
指标,设置
size
:最小尺寸10,最大尺寸50
点击
apply
再次选择
Layout
模块,选中
Adjust by Sizes
点击
run
,重新布局
5. 标签(Label)
(1)显示节点标签
(2)设置标签大小
(3)使用滑块设置标签大小
显示如下:
6. 社区发现(Community detection)
社区发现是网络分析的核心,Gephi实现了Louvain算法,该算法是一种基于模块度的社区发现算法。
选择左侧面板的
Statistics
模块,选择
Modularity
,点击
run
。
点击
ok
,显示结果如下
社区发现算法为每个节点创建了一个”Modularity Class”值,选中左侧面板的
Partition
模块,选择
Modularity Class
可通过
Data Laboratory
查看具体指标
点击
apply
为节点着色,显示如下
7. 过滤(Filter)
通过创建过滤器可隐藏网络的节点和边
选择右侧面板的
Filter
模块,选择 “Topology” 分类下的“Degree Range”
将其拖拽到
Queries
显示如下:
点击
Degree Range
,激活Filter,并移动滑块将下界设置为2,
点击
Filter
8. 预览(Preview)
选择
Preview
选项卡
完成属性设置后,
点击Refresh,显示如下
可导出为SVG/PDF/PNG