SkipLis和java中ConcurrentSkipListMap的实现
一开始听说SkipList我是一脸懵逼的,啥?还有SkipList?这个是什么玩意。
后面经过我的不断搜索和学习,终于明白了SkipList原来是一种数据结构,而java中的ConcurrentSkipListMap和ConcurrentSkipListSet就是这种结构的实现。
接下来就让我们一步一步的揭开SkipList和ConcurrentSkipListMap的面纱吧。
先看下维基百科中SkipList的定义:
SkipList是一种层级结构。最底层的是排序过的最原始的linked list。
往上是一层一层的层级结构,每个底层节点按照一定的概率出现在上一层list中。这个概率叫做p,通常p取1/2或者1/4。
先设定一个函数f,可以随机产生0和1这两个数,并且这两个数出现的几率是一样的,那么这时候的p就是1/2。
对每个节点,我们这样操作:
我们运行一次f,当f=1时,我们将该节点插入到上层layer的list中去。当f=0时,不插入。
举个例子,上图中的list中有10个排序过的节点,第一个节点默认每层都有。对于第二个节点,运行f=0,不插入。对于第三个节点,运行f=1,将第三个节点插入layer 1,以此类推,最后得到的layer 1 list中的节点有:1,3,4,6,9。
然后我们再继续往上构建layer。 最终得到上图的SkipList。
通过使用SkipList,我们构建了多个List,包含不同的排序过的节点,从而提升List的查找效率。
我们通过下图能有一个更清晰的认识:
每次的查找都是从最顶层开始,因为最顶层的节点数最少,如果要查找的节点在list中的两个节点中间,则向下移一层继续查找,最终找到最底层要插入的位置,插入节点,然后再次调用概率函数f,决定是否向上复制节点。
其本质上相当于二分法查找,其查找的时间复杂度是O(logn)。
ConcurrentSkipListMap是一个并发的SkipList,那么它具有两个特点,SkipList和concurrent。我们分别来讲解。
上面讲解了SkipList的数据结构,接下来看下ConcurrentSkipListMap是怎么实现这个skipList的:
ConcurrentSkipListMap中有三种结构,base nodes,Head nodes和index nodes。
base nodes组成了有序的链表结构,是ConcurrentSkipListMap的最底层实现。
static final class Node<K,V> { final K key; volatile Object value; volatile Node<K,V> next; /** * Creates a new regular node. */ Node(K key, Object value, Node<K,V> next) { this.key = key; this.value = value; this.next = next; } }
上面可以看到每个Node都是一个k,v的entry,并且其有一个next指向下一个节点。
index nodes是构建SkipList上层结构的基本节点:
static class Index<K,V> { final Node<K,V> node; final Index<K,V> down; volatile Index<K,V> right; /** * Creates index node with given values. */ Index(Node<K,V> node, Index<K,V> down, Index<K,V> right) { this.node = node; this.down = down; this.right = right; } }
从上面的构造我们可以看到,Index节点包含了Node节点,除此之外,Index还有两个指针,一个指向同一个layer的下一个节点,一个指向下一层layer的节点。
这样的结构可以方便遍历的实现。
最后看一下HeadIndex,HeadIndex代表的是Head节点:
static final class HeadIndex<K,V> extends Index<K,V> { final int level; HeadIndex(Node<K,V> node, Index<K,V> down, Index<K,V> right, int level) { super(node, down, right); this.level = level; } }
HeadIndex和Index很类似,只不过多了一个level字段,表示所在的层级。
在ConcurrentSkipListMap初始化的时候,会初始化HeadIndex:
head = new HeadIndex<K,V>(new Node<K,V>(null, BASE_HEADER, null),null, null, 1);
我们可以看到HeadIndex中的Node是key=null,value=BASE_HEADER的虚拟节点。初始的level=1。
接下来,我们再看一下并发是怎么实现的:
基本上并发类都是通过UNSAFE.compareAndSwapObject来实现的,ConcurrentSkipListMap也不例外。
假如我们有三个节点,b-n-f。现在需要删除节点n。
第一步,使用CAS将n的valu的值从non-null设置为null。这个时候,任何外部的操作都会认为这个节点是不存在的。但是那些内部的插入或者删除操作还是会继续修改n的next指针。
第二步,使用CAS将n的next指针指向一个新的marker节点,从这个时候开始,n的next指针将不会指向任何其他的节点。
我们看下marker节点的定义:
Node(Node<K,V> next) { this.key = null; this.value = this; this.next = next; }
我们可以看到marker节点实际上是一个key为null,value是自己的节点。
第三步,使用CAS将b的next指针指向f。从这一步起,n节点不会再被其他的程序访问,这意味着n可以被垃圾回收了。
我们思考一下为什么要插入一个marker节点,这是因为我们在删除的时候,需要告诉所有的线程,节点n准备被删除了,因为n本来就指向f节点,这个时候需要一个中间节点来表示这个准备删除的状态。
本文从SkipList数据结构开始,讲解了ConcurrentSkipListMap的实现。希望大家能够喜欢。