UUID是如何保证唯一性的?
为了保证UUID的唯一性,规范定义了包括网卡MAC地址、时间戳、名字空间(Namespace)、随机或伪随机数、时序等元素。当然,你要说UUID是不是绝对的不会出现重复的,这个也不能这样说的(我下面会提到)。
UUID具有以下涵义:
经由一定的算法机器生成为了保证UUID的唯一性,规范定义了包括
网卡MAC地址
、
时间戳
、
名字空间(Namespace)
、
随机或伪随机数
、
时序
等元素,以及从这些元素生成UUID的算法。UUID的复杂特性在保证了其唯一性的同时,意味着只能由计算机生成。
非人工指定,非人工识别UUID是不能人工指定的,除非你冒着UUID重复的风险。UUID的复杂性决定了“一般人“不能直接从一个UUID知道哪个对象和它关联。
在特定的范围内重复的可能性极小UUID的生成规范定义的算法主要目的就是要保证其唯一性。但这个唯一性是有限的,只在特定的范围内才能得到保证,这和UUID的类型有关(参见UUID的版本)。
UUID的版本UUID具有多个版本,每个版本的算法不同,应用范围也不同。首先是一个特例--
Nil UUID
--通常我们不会用到它,它是由全为0的数字组成,如下:00000000-0000-0000-0000-000000000000
UUID Version 1
:基于时间的UUID基于时间的UUID通过计算当前时间戳、随机数和机器MAC地址得到。由于在算法中使用了MAC地址,这个版本的UUID可以保证在全球范围的唯一性。但与此同时,使用MAC地址会带来安全性问题,这就是这个版本UUID受到批评的地方。如果应用只是在局域网中使用,也可以使用退化的算法,以IP地址来代替MAC地址--Java的UUID往往是这样实现的(当然也考虑了获取MAC的难度)。
UUID Version 2
:DCE安全的UUIDDCE(Distributed Computing Environment)安全的UUID和基于时间的UUID算法相同,但会把时间戳的前4位置换为POSIX的UID或GID。这个版本的UUID在实际中较少用到。
UUID Version 3
:基于名字的UUID(MD5)基于名字的UUID通过计算名字和名字空间的MD5散列值得到。这个版本的UUID保证了:相同名字空间中不同名字生成的UUID的唯一性;不同名字空间中的UUID的唯一性;相同名字空间中相同名字的UUID重复生成是相同的。
UUID Version 4
:随机UUID根据随机数,或者伪随机数生成UUID。这种UUID产生重复的概率是可以计算出来的,但随机的东西就像是买彩票:你指望它发财是不可能的,但狗屎运通常会在不经意中到来。
UUID Version 5
:基于名字的UUID(SHA1)和版本3的UUID算法类似,只是散列值计算使用SHA1(Secure Hash Algorithm 1)算法。
UUID的应用从UUID的不同版本可以看出,Version 1/2适合应用于分布式计算环境下,具有高度的唯一性;Version 3/5适合于一定范围内名字唯一,且需要或可能会重复生成UUID的环境下;至于Version 4,个人的建议是最好不用(虽然它是最简单最方便的)。通常我们建议使用UUID来标识对象或持久化数据,但以下情况最好不使用UUID: 映射类型的对象。比如只有代码及名称的代码表。 人工维护的非系统生成对象。比如系统中的部分基础数据。对于具有名称不可重复的自然特性的对象,最好使用Version 3/5的UUID。比如系统中的用户。如果用户的UUID是Version 1的,如果你不小心删除了再重建用户,你会发现人还是那个人,用户已经不是那个用户了。(虽然标记为删除状态也是一种解决方案,但会带来实现上的复杂性。)
上面这段解析文是知乎一位朋友的理解(
https://www.zhihu.com/question/34876910#answer-31004674
),个人感觉从UUID的概念、特征描述比较透彻。
JAVA中UUID的使用
我们来看看在JAVA中UUID的使用方式:
查看jdk提供的uuid的api发现。
uuid 提供了两个方法:randomUUID() 和nameUUIDFromBytes()两个方法。
其中:randomUUID()是随机(适用于唯一订单号)的。
nameUUIDFromBytes(byte[] n)会根据n产生唯一的uuid。只要有用户的唯一性信息。就能保证此用户的uuid的唯一性。例如(身份证号等)
我们更愿意使用自定义唯一编号,再使用该编号生成唯一的UUID。
我们通过一个非常简单的例子来展示UUID的使用:
package byron4j.dlzd;
import java.util.UUID;
public class UuidDemo {
public static void main(String[] args) {
System.out.println(UUID.randomUUID().toString().replace("-", ""));
System.out.println(UUID.randomUUID().version());
System.out.println(UUID.nameUUIDFromBytes("890110866094329856".getBytes()).toString().replace("-", ""));
System.out.println(UUID.nameUUIDFromBytes("890110866094329856".getBytes()).version());
}
}
用例输出结果如下:
d9613ff9975b47e3a8bb1ef3766f7a86
4
873473466cf23b5fb988827f8dffbe7d
3
我们比较 randomUUID() 和 nameUUIDFromBytes(byte[])方法, 可以得知 其内部使用的是算法版本分别是4、3; 因为我们更趋向于使用版本3、5的算法实现, 所以在实际生产中,推荐使用 nameUUIDFromBytes方法将自身的唯一id转换为UUID形式。