ConcurrentHashMap

  • Post author:
  • Post category:其他




一、ConcurrentHashMap在1.8做了哪些优化?

在这里插入图片描述



1.1 存储结构

  • JDK1.8中是以CAS+synchronized实现的线程安全
  • CAS:在没有hash冲突时(Node要放在数组上时)
  • synchronized:出现hash冲突时(Node存放的位置已经有数据了)
  • 存储结构:数组+链表+红黑树
  • 出现hash冲突后,数据会挂在链表上,此时查询的时间复杂度为(O)n,链表长度过长时,查询效率过低。
  • 因此1.8后引入红黑树
  • 当里链表长度大于8,数组长度大于等于64时,将链表转为红黑树,(O)logn

在这里插入图片描述



1.2 存储操作

锁头结点:锁的粒度增大

数据放在数组上时,用CAS;

数据放在链表上,用synchronized,操作哪个节点,只锁对应的节点,因此数组长度有多少,锁的级别就有多少



1.3 扩容

//链表长度大于等于8时,尝试将链表转为红黑树
private final void treeifyBin(Node<K,V>[] tab, int index) {
        Node<K,V> b; int n, sc;
    //数组不能为空
        if (tab != null) {
            //数组的长度n,是否小于64
            if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
                //如果数组长度小于64,不能将链表转为红黑树,先尝试扩容
                tryPresize(n << 1);
            else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
                synchronized (b) {
                    if (tabAt(tab, index) == b) {
                        TreeNode<K,V> hd = null, tl = null;
                        for (Node<K,V> e = b; e != null; e = e.next) {
                            TreeNode<K,V> p =
                                new TreeNode<K,V>(e.hash, e.key, e.val,
                                                  null, null);
                            if ((p.prev = tl) == null)
                                hd = p;
                            else
                                tl.next = p;
                            tl = p;
                        }
                        setTabAt(tab, index, new TreeBin<K,V>(hd));
                    }
                }
            }
        }
    }



1.4 计数器

计数器由AtomicLong换成类似于LongAdder的一个功能



1.4.1 AtomicLong:

基于CAS操作实现,并发较高情况下,多个现场同时CAS,只会有一个成功,没有成功的线程会一直执行CAS直到成功为止。



1.4.2 LongAdder:

如果并发执行自增操作时,CAS失败了,会将数据单独存储在一个数组中计数。



二、ConcurrentHashMap的散列算法?

目的,原本只有低位参与了运算,通过散列算法尽量打撒我的数据,将key的hashCode值的高16位进行^运算,最终又与HASH_BITS进行&运算,尽量平均的分摊到真个map的存储上。

final V putVal(K key, V value, boolean onlyIfAbsent) {
    //ConcurrentHashMap不允许key或者value出现null值
        if (key == null || value == null) throw new NullPointerException();
    //根据key的hashCode计算出一个hash值,后期得出当前key-value要存储在哪个数组索引位置
        int hash = spread(key.hashCode());
    //一个标识
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            //n:数组长度
            //i:当前索引的位置
            //f:当前数组i索引位置的Node对象
            //fn:当前数组i索引位置上数据的hash值
            Node<K,V> f; int n, i, fh;
            //判断当前数组是否还没有初始化
            if (tab == null || (n = tab.length) == 0)
                //将数组进行初始化
                tab = initTable();
            //基于(n-1) & hash 计算出当前Node需要存放在哪个索引位置
            //基于tabAt获取到i位置的数据
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                //现在数组的i位置上没有数据,基于CAS的方式将数据存放在i上
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    //如果成功,执行break跳出循环,插入数据成功
                    break;                   // no lock when adding to empty bin
            }
            //判断当前位置数据是否正在扩容
            else if ((fh = f.hash) == MOVED)
                //让当前插入数据的线程协助扩容
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }
    static final int HASH_BITS = 0x7fffffff;  
//计算当前Node的hash值的方法    
static final int spread(int h) {
        //将key的hashCode值的高16位进行^运算,最终又与HASH_BITS进行&运算
        //将最高位的hash也参与到计算索引位置的运算中
        //为什么HashMap、ConcurrentHashMap都要求数组长度为2^n
    //HASH_BITS让hash值的最高位符号位肯定为0,代表当前hash值默认情况下一定为正数,因为hash值为负数时,有特殊的含义
    //static final int MOVED     = -1; // 代表当前hash位置的数据正在扩容!
    //static final int TREEBIN   = -2; // 代表当前hash位置下挂载的是一个红黑树
    //static final int RESERVED  = -3; // 预留当前索引位置
        return (h ^ (h >>> 16)) & HASH_BITS;
    //计算数组放在哪个索引位置的方法(f = tabAt(tab, i = (n-1) & hash))
    //n 是数组的长度
    }



三、ConcurrentHashMap初始化数组的流程?

懒加载:第一次添加数据时,才会初始化数组。

//数组在初始化和扩容操作时的一个控制变量
//-1:代表当前数组正在初始化
//小于-1:低16位代表当前数组正在扩容的线程个数(如果1个线程扩容,值为-2;如果2个线程扩容,值为-3)
//0:代表数组还没初始化
//大于0:代表当前数组的扩容阈值,或者是当前数组的初始化大小
private transient volatile int sizeCtl;
//初始化数组方法
private final Node<K,V>[] initTable() {
    //声明标识
    Node<K,V>[] tab; int sc;
    //再次判断数组没有初始化,并且完成tab赋值    
    while ((tab = table) == null || tab.length == 0) {
        //将sizeCtl赋值给sc变量,并判断是否小于0
            if ((sc = sizeCtl) < 0)
                Thread.yield(); 
        // 可以尝试初始化数组,线程会以CAS的方式,将sizeCtl修改为-1,代表当前线程可以初始化数组
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                //尝试初始化
                try {
                    //再次判断当前数组是否已经初始化完毕
                    if ((tab = table) == null || tab.length == 0) {
                        //开始初始化
                        //如果sizeCtl > 0 ,就初始化sizeCtl长度的数组
                        //如果sizeCtl ==0 ,就初始化默认的长度
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        //初始化数组!
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        //将初始化的数组nt,赋值给tab和table
                        table = tab = nt;
                        //sc赋值为了数组长度 - 数组长度 右移 2位  16-4=12
                        //将sc赋值为下次扩容的阈值
                        sc = n - (n >>> 2);
                    }
                } finally {
                    //将赋值好的sc,设置给sizeCtl
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }



四、ConcurrentHashMap扩容的流程?

  • 确认什么时候触发扩容
  • 计算扩容标识戳
  • 将扩容表示戳往左移16位+2(代表第一个进来扩容的)
  • 计算每个线程迁移的长度
  • 初始化一个全新的数组
  • 线程领取任务,从多少索引位置迁移到多少索引位置
  • 开始扩容、迁移数据
  • 判断是否为最后一个完成迁移的
  • 如果是则全局检查一次有没有遗漏的数据
   //链表长度大于等于8时,尝试将链表转为红黑树
private final void treeifyBin(Node<K,V>[] tab, int index) {
        Node<K,V> b; int n, sc;
    //数组不能为空
        if (tab != null) {
            //数组的长度n,是否小于64
            if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
                //如果数组长度小于64,不能将链表转为红黑树,先尝试扩容
                tryPresize(n << 1);
            else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
                synchronized (b) {
                    if (tabAt(tab, index) == b) {
                        TreeNode<K,V> hd = null, tl = null;
                        for (Node<K,V> e = b; e != null; e = e.next) {
                            TreeNode<K,V> p =
                                new TreeNode<K,V>(e.hash, e.key, e.val,
                                                  null, null);
                            if ((p.prev = tl) == null)
                                hd = p;
                            else
                                tl.next = p;
                            tl = p;
                        }
                        setTabAt(tab, index, new TreeBin<K,V>(hd));
                    }
                }
            }
        }
    }



4.2 tryPresize方法-针对putAll初始化操作

//size是将之前的数组长度 左移1位得到的结果
private final void tryPresize(int size) {
    //如果扩容的长度达到了最大值,就使用最大值
    //否则需要保证数组的长度为2的n次幂
    //这块的操作,是为了初始化操作准备的,因为调用putAll方法时,也会触发tryPresize方法
    //如果刚刚new的ConcurrentHashMap直接调用饿了putAll方法,会通过tryPresize方法进行初始化
        int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
            tableSizeFor(size + (size >>> 1) + 1);
    //这些代码和initTable一模一样
    //声明sc
        int sc;
    //将sizeCtl的值赋给sc,并且判断是否大于0,这里代表没有初始化操作,也没有扩容操作
        while ((sc = sizeCtl) >= 0) {
            //将ConcurrentHashMap的table值赋值给tab,并声明数组长度n
            Node<K,V>[] tab = table; int n;
            //数组是否需要初始化
            if (tab == null || (n = tab.length) == 0) {
                n = (sc > c) ? sc : c;
                if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                    try {
                        if (table == tab) {
                            @SuppressWarnings("unchecked")
                            Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                            table = nt;
                            sc = n - (n >>> 2);
                        }
                    } finally {
                        sizeCtl = sc;
                    }
                }
            }
            else if (c <= sc || n >= MAXIMUM_CAPACITY)
                break;
            else if (tab == table) {
                //计算扩容表示戳,根据当前数组的长度计算一个16位的扩容戳
                //第一个作用是为了保证后面的sizeCtl赋值时,保证sizeCtl为小于-1的负数
                //第二个作用用来记录当前是从什么长度开始扩容的
                int rs = resizeStamp(n);
                //如果sc小于0,代表有线程正在扩容
                if (sc < 0) {
                    Node<K,V>[] nt;
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                //代表没有线程正在扩容,我是第一个
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
            }
        }
    }



4.3 transfer方法计算每个线程迁移的长度

//开始扩容    
private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        //n = 数组长度
    //stride = 每个线程一次性迁移多少数据到新数组
        int n = tab.length, stride;
    //基于CPU内核数组来计算,每个线程一次性迁移多少长度的数据最合理
    //NCPU=4
    //例:数组长度为1024 - 512 - 256 - 128  / 4 = 32 
    //MIN_TRANSFER_STRIDE = 16,为每个线程迁移数据的最小长度
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; 
    // 根据CPU计算每个线程一次迁移多长的数据到新数组,如果结果大于16,使用计算结果;
    //如果小于16,就使用最小长度。

    }



五、ConcurrentHashMap读取数据的流程?

  • 不会阻塞读取数据的线程。
  • 先判断当前key对应的value,是否在数组上。
  • 其次判断当前位置是否属于特殊情况:数据被迁移、位置被占用、红黑树结构。
  • 最后判断链表上是否有对应的数据。



5.1 get方法-查询数据的入口

    public V get(Object key) {
        //tab:数组;e:查询指定位置的节点;n:数组长度
        Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
        //基于传入的key,计算hash值
        int h = spread(key.hashCode());
        //数组不为null,数组得有数据,拿到指定位置的数组上的数据
        if ((tab = table) != null && (n = tab.length) > 0 && (e = tabAt(tab, (n - 1) & h)) != null) {
            //数组上数据的hash值,是否和查询条件key的hash值一样
            if ((eh = e.hash) == h) {
                //key的==或者equals是否一致,一致则数组上就是要查询的数据
                if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                    return e.val;
            }
            //如果数组上的数据的hash值为负数,有特殊情况
            else if (eh < 0)
                //三种情况:数据迁移、节点位置被占、红黑树结构
                return (p = e.find(h, key)) != null ? p.val : null;
            //肯定走链表操作
            while ((e = e.next) != null) {
                //如果hash值一致,并且key的==或者equals一致,返回当前链表位置的数据
                if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                    return e.val;
            }
        }
        //如果上述三个流程都没有找到指定key对应的value,那就是key不存在,返回null
        return null;
    }

数据迁移:

Node<K,V> find(int h, Object k) {
            //找到迁移后的新数组
            outer: for (Node<K,V>[] tab = nextTable;;) {
                Node<K,V> e; int n;
                if (k == null || tab == null || (n = tab.length) == 0 ||
                    (e = tabAt(tab, (n - 1) & h)) == null)
                    return null;
                for (;;) {
                    int eh; K ek;
                    if ((eh = e.hash) == h &&
                        ((ek = e.key) == k || (ek != null && k.equals(ek))))
                        return e;
                    if (eh < 0) {
                        if (e instanceof ForwardingNode) {
                            tab = ((ForwardingNode<K,V>)e).nextTable;
                            continue outer;
                        }
                        else
                            return e.find(h, k);
                    }
                    if ((e = e.next) == null)
                        return null;
                }
            }
        }

红黑树:

        final Node<K,V> find(int h, Object k) {
            if (k != null) {
                for (Node<K,V> e = first; e != null; ) {
                    int s; K ek;
                    //判断你是否正在有写的操作或者有写的操作在等待
                    //查询转换红黑树时保留的双向链表
                    if (((s = lockState) & (WAITER|WRITER)) != 0) {
                        if (e.hash == h &&
                            ((ek = e.key) == k || (ek != null && k.equals(ek))))
                            return e;
                        e = e.next;
                    }
                    //如果已经没有写操作在进行了,直接去红黑树上查找
                    else if (U.compareAndSwapInt(this, LOCKSTATE, s,
                                                 s + READER)) {
                        TreeNode<K,V> r, p;
                        try {
                            p = ((r = root) == null ? null :
                                 r.findTreeNode(h, k, null));
                        } finally {
                            Thread w;
                            if (U.getAndAddInt(this, LOCKSTATE, -READER) ==
                                (READER|WAITER) && (w = waiter) != null)
                                LockSupport.unpark(w);
                        }
                        return p;
                    }
                }
            }
            return null;
        }



六、ConcurrentHashMap中计数器的实现

  • addCount方法中:记录Map中存储了多少个元素
  • 为防止效率过低,
  • 除了baseCount之外,还准备了多个CounterCell数组,
  • 最后将baseCount的值以及每个CounterCell数组中值进行累加
    private final void addCount(long x, int check) {
        CounterCell[] as; long b, s;
        
        //baseCount:记录某个元素组个数
        //并发量较大时,向 CounterCell[] as中添加数据
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
            CounterCell a; long v; int m;
            boolean uncontended = true;
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
                fullAddCount(x, uncontended);
                return;
            }
            if (check <= 1)
                return;
            s = sumCount();
        }
        
        if (check >= 0) {
            Node<K,V>[] tab, nt; int n, sc;
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
                int rs = resizeStamp(n);
                if (sc < 0) {
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                        transfer(tab, nt);
                }
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }
    }
    final long sumCount() {
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        //判断是否已经向CounterCell[] as中添加数据
        if (as != null) {
            //遍历数组,每一个值使用+=方式存储近sum
            for (int i = 0; i < as.length; ++i) {
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }



版权声明:本文为Zyw907155124原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。