并发编程—AQS(AbstractQueuedSynchronizer)

AbstractQueuedSynchronizer(简称AQS)类是整个JUC包的核心类。它是实现JCU包里ReentrantLockCountDownLatchSemaphoreFutureTask等类的基础,阅读这些类的源码,会发现这些类都有一个内部类Sync,它们的功能也是通过Sync的具体子类来实现的,而所有的Sync都是继承自AbstractQueuedSynchronizer。 所以想要理解JUC包中的类,AbstractQueuedSynchronizer这个抽象类是基础。

AQS的结构分析

AQS的成员变量

AbstractQueuedSynchronizer类的几个重要属性如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
/**
* Head of the wait queue, lazily initialized. Except for
* initialization, it is modified only via method setHead. Note:
* If head exists, its waitStatus is guaranteed not to be
* CANCELLED.
*
* 队列头结点。只通过setHead(Node node)方法来设置该属性
*/
private transient volatile Node head;

/**
* Tail of the wait queue, lazily initialized. Modified only via
* method enq to add new wait node.
*
* 队列的尾节点。只通过enq(final Node node)方法来设置该属性
*/
private transient volatile Node tail;

/**
* The synchronization state.
*
* 同步器的状态。这是最核心的属性,通过它可以实现各种具体的功能。
*/
private volatile int state;

它的这三个成员变量,构成了AQS的核心内容:state、CLH同步队列和Node。

state状态

AQS内部通过一个int类型的state属性表示同步状态,状态的具体含义可以子类来定义,例如ReentrantLock中用state表示线程重入的次数,Semaphore表示可用的许可的数量等。使用int是由于int能够应对大部分的场景,而long在很多平台需要使用额外锁来保证一致性的读取(long类型变量的赋值不具备原子性)。
并且state字段使用了volatile修饰,保证了state字段的可见性。state的访问方式有三种:

  • getState()
  • setState()
  • compareAndSetState()

其中compareAndSetState()的调用了Unsafe类compareAndSwapInt()方法通过CAS的方式实现,保证了更新操作的原子性。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
/**
* Returns the current value of synchronization state.
* This operation has memory semantics of a {@code volatile} read.
* @return current state value
*/
protected final int getState() {
return state;
}

/**
* Sets the value of synchronization state.
* This operation has memory semantics of a {@code volatile} write.
* @param newState the new state value
*/
protected final void setState(int newState) {
state = newState;
}

/**
* Atomically sets synchronization state to the given updated
* value if the current state value equals the expected value.
* This operation has memory semantics of a {@code volatile} read
* and write.
*
* @param expect the expected value
* @param update the new value
* @return {@code true} if successful. False return indicates that the actual
* value was not equal to the expected value.
*/
protected final boolean compareAndSetState(int expect, int update) {
// See below for intrinsics setup to support this
return unsafe.compareAndSwapInt(this, stateOffset, expect, update);
}

CLH同步队列

AQS依赖一个CLH同步队列(一个FIFO双向队列)来完成同步状态的管理,当前线程获取同步状态失败时,同步器会将当前线程以及等待状态等信息包装成一个节点(Node)并将其加入到CLH同步队列,同时会阻塞当前线程;当同步状态释放时,会把首节点中的线程唤醒(公平锁),使其再次尝试获取同步状态。

Node

CLH同步队列中的节点是一个Node对象,Node是AQS的一个内部类。Node其实就是对当前线程的包装,Node对象中保存了线程的引用(thread)、状态(waitStatus)、前驱节点(prev)、后继节点(next)等变量。

waitStatus表示当前Node节点的等待状态,共有5种取值CANCELLED、SIGNAL、CONDITION、PROPAGATE、0。

  • CANCELLED(1):表示当前节点已取消获取资源。例如当前线程获取资源timeout或被中断(响应中断的情况下),会变为此状态,此状态也意味着该节点会被从队列中移除。
  • SIGNAL(-1):表示后继节点在等待当前结点唤醒。后继结点入队时,会将前继结点的状态更新为SIGNAL。
  • CONDITION(-2):表示结点等待在Condition上,当其他线程调用了Condition的signal()方法后,CONDITION状态的结点将从等待队列转移到同步队列中,等待获取同步锁。
  • PROPAGATE(-3):共享模式下,前继结点不仅会唤醒其后继结点,同时也可能会唤醒后继的后继结点。
  • INITIAL(0):新结点入队时的默认初始状态。

节点有两种资源共享方式:Exclusive(独占,只有一个线程能操作资源,如ReentrantLock)和Share(共享,多个线程可同时操作资源,如Semaphore/CountDownLatch)。其中独占节点的waitStatus使用其中的CANCELLED(1)、SIGNAL(-1)、CONDITION(-2),共享节点使用CANCELLED(1)、SIGNAL(-1)、PROPAGATE(-3)。

注意,负值表示节点处于有效等待状态,而正值表示节点已被取消调度。所以源码中很多地方用>0、<0来判断节点的状态是否正常。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
static final class Node {

// 用来标识共享模式下等待队列中的节点
static final Node SHARED = new Node();

// 用来标识独占模式下等待队列中的节点
static final Node EXCLUSIVE = null;

// ======== 下面的几个int常量是给waitStatus用的 ===========
static final int CANCELLED = 1;

static final int SIGNAL = -1;

static final int CONDITION = -2;

static final int PROPAGATE = -3;
// =====================================================


// 节点等待状态。只能取CANCELLED、SIGNAL、CONDITION、PROPAGATE、0这五个固定值
volatile int waitStatus;

// 前驱节点的引用
volatile Node prev;

// 后继节点的引用
volatile Node next;

// 结点所包装的线程
volatile Thread thread;

// Condition队列使用,存储condition队列中的后继节点
Node nextWaiter;

Node() {
}

Node(Thread thread, Node mode) {
this.nextWaiter = mode;
this.thread = thread;
}
}

AQS的设计与源码分析

AQS的设计是基于模版方法模式的,也就是说,自定义同步器(子类)需要继承AbstractQueuedSynchronizer类并重写指定的方法,不同的子类用state代表不同的语义,例如Semaphore中state表示可以访问资源的线程数量,ReentrantLock表示加锁的次数。

以ReentrantLock为例,state初始化为0,表示未锁定状态。A线程lock()时,会调用tryAcquire()独占该锁并将state+1。此后,其他线程再tryAcquire()时就会失败,直到A线程unlock()到state=0(即释放锁)为止,其它线程才有机会获取该锁。当然,释放锁之前,A线程自己是可以重复获取此锁的(state会累加),这就是可重入的概念。但要注意,获取多少次就要释放多么次,这样才能保证state能回到零态。

再以CountDownLatch以例,任务分为N个子线程去执行,state也初始化为N(注意N要与线程个数一致)。这N个子线程是并行执行的,每个子线程执行完后countDown()一次,state会CAS减1。等到所有子线程都执行完后(即state=0),会unpark()主调用线程,然后主调用线程就会从await()函数返回,继续后余动作。

子类只需要实现操作共享资源state的获取与释放方式即可,至于具体线程在CLH同步队列的维护(如获取资源失败入队/唤醒出队等),AQS已经在顶层实现好了。

子类主要是实现以下几种方法:

  • isHeldExclusively():该线程是否正在独占资源。只有用到condition才需要去实现它。
  • tryAcquire(int):独占方式。尝试获取资源,成功则返回true,失败则返回false。
  • tryRelease(int):独占方式。尝试释放资源,成功则返回true,失败则返回false。
  • tryAcquireShared(int):共享方式。尝试获取资源。负数表示失败;0表示成功,但没有剩余可用资源;正数表示成功,且有剩余资源。
  • tryReleaseShared(int):共享方式。尝试释放资源,如果释放后允许唤醒后续等待结点返回true,否则返回false。

AQS定义两种资源共享方式:Exclusive(独占,只有一个线程能执行,如ReentrantLock)和Share(共享,多个线程可同时执行,如Semaphore/CountDownLatch)。
一般来说,自定义同步器要么是独占方式,要么是共享方式,他们也只需实现tryAcquire-tryRelease、tryAcquireShared-tryReleaseShared中的其中一种即可。但AQS也支持自定义同步器同时实现独占和共享两种方式,如ReentrantReadWriteLock。

下面开始分析AQS的源码,可以让我们知道顶层已经实现了那些功能。

acquire(int)

此方法是独占模式下线程访问共享资源的顶层入口。如果获取到资源,线程直接返回,否则进入等待队列,直到获取到资源为止,且整个过程忽略中断的影响。这也正是lock()的语义,当然不仅仅只限于lock()。获取到资源后,线程就可以去执行其临界区代码了。下面是acquire()的源码:

1
2
3
4
5
public final void acquire(int arg) {
if (!tryAcquire(arg) &&
acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
selfInterrupt();//线程自我中断后,线程才继续调用后面的方法
}

方法流程如下:

  1. tryAcquire()尝试直接去获取资源,如果成功则直接返回(这里体现了非公平锁,每个线程获取锁时会尝试直接抢占加塞一次,而CLH队列中可能还有别的线程在等待);
  2. addWaiter()将该线程加入等待队列的尾部,并标记为独占模式;
  3. acquireQueued()使线程阻塞在等待队列中获取资源,一直获取到资源后才返回。如果在整个等待过程中被中断过,则返回true,否则返回false。
  4. 如果线程在等待过程中被中断过,它是不响应的。只是获取资源后才再进行自我中断selfInterrupt(),将中断补上。

tryAcquire(int)

此方法尝试去获取独占资源。如果获取成功,则直接返回true,否则直接返回false。这也正是tryLock()的语义,还是那句话,当然不仅仅只限于tryLock()。如下是tryAcquire()的源码:

1
2
3
protected boolean tryAcquire(int arg) {
throw new UnsupportedOperationException();
}

直接throw异常?因为前面已经讲过AQS只是一个框架,它只定义了一个tryAcquire(int arg)接口,具体获取/释放资源的方式交由自定义同步器去实现通过state的get/set/CAS,具体至于能不能重入,能不能加塞,那就看自定义同步器怎么去设计了。当然,自定义同步器在进行资源访问时要考虑线程安全的影响。

这里之所以没有定义成abstract,是因为独占模式下只需要实现tryAcquire和tryRelease,而共享模式下只需要实现tryAcquireShared和tryReleaseShared。如果都定义成abstract,那么每个模式也要去实现另一模式下的接口。说到底,Doug Lea还是站在咱们开发者的角度,尽量减少不必要的工作量。

addWaiter(Node)

前面已经讲过线程要访问资源时,会先尝试快速获取一下,如果尝试获取失败了呢?那么就需要将线程放入队列中去等待了,也即是CLH队列入队。熟悉数据结构的同学应该知道,CLH队列入队的过程,无非就是tail指向新节点、新节点的prev指向当前最后的节点(旧tail)、当前最后一个节点(旧tail)的next指向新节点。

CLH队列入队这个过程包括了addWaiter(Node)enq(Node)两个方法,细节请参考下面对源码的注释说明。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
private Node addWaiter(Node mode) {
//以给定模式构造结点。mode有两种:EXCLUSIVE(独占)和SHARED(共享)
Node node = new Node(Thread.currentThread(), mode);

//tail!=null => 队列不为空,尝试快速方式直接放到队尾。
Node pred = tail;
if (pred != null) {
node.prev = pred;
if (compareAndSetTail(pred, node)) {
//上面已经有 node.prev = pred,加上下面这句,实现了和之前的尾节点双向连接
pred.next = node;
return node;
}
}

//pred==null(队列是空的) 或者 CAS失败(有线程在竞争入队),则通过enq入队。
enq(node);
return node;
}

enq(Node)

参考注释:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
/**
* 入队(enqueue)
*/
private Node enq(final Node node) {
for (;;) { // 自旋方式入队。自旋在这里的语义是:CAS设置tail过程中,一次竞争不到,我就多次竞争,总会排到的
Node t = tail;
if (t == null) { //tail属性必须先初始化,当前节点再入队。如果addWaiter方法中判断队列为空会走此分支,如果是addWaiter方法CAS失败,会走下面的else分支
if (compareAndSetHead(new Node()))
//tail属性只通过此方法的此处赋值。设置完了以后,继续for循环,下次就到下面的else分支了
tail = head;
} else {
node.prev = t;
if (compareAndSetTail(t, node)) {
//上面已经有 node.prev = t,加上下面这句,又实现了和之前的尾节点双向连接,和addWaiter方法中是类似的
t.next = node;
return t;
}
}
}
}

这里还有一个疑问:compareAndSetHead(new Node())为什么要new一个Node对象设置到head属性,而不用在addWaiter(Node)方法中new的那个独占模式的Node对象呢?

acquireQueued(Node, int)

OK,如果tryAcquire(int)失败,并且addWaiter(Node)已经完成,该线程一开始尝试获取资源失败,已经被放入等待队列尾部了。聪明的你立刻应该能想到该线程下一部该干什么了吧:进入等待状态休息,直到其他线程彻底释放资源后唤醒自己,自己再拿到资源,然后就可以去干自己想干的事了。没错,就是这样!是不是跟医院排队拿号有点相似~~
acquireQueued(Node, int)就是干这件事:在等待队列中排队拿号(中间没其它事干可以休息),直到拿到号后再返回。这个函数非常关键,真正的线程挂起和唤醒,都在这个方法里了,还是上源码吧:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
final boolean acquireQueued(final Node node, int arg) {
boolean failed = true;//标记获取资源是否失败
try {
boolean interrupted = false;//标记等待过程中是否被中断过

//又是一个“自旋”
for (;;) {
final Node p = node.predecessor();//拿到前驱节点
//如果前驱节点就是head,即当前结点已成老二,那么便有资格去尝试获取资源(可能是老大释放完资源唤醒自己的,当然也可能被interrupt了)。
if (p == head && tryAcquire(arg)) {
setHead(node);//拿到资源后,将head指向该结点。所以head指向的是当前获取到了资源的节点或null。
p.next = null; // setHead中node.prev已置为null,此处再将head.next置为null,就是为了方便GC回收以前的head节点。也就意味着之前拿完资源的节点出队了!
failed = false; // 成功获取资源
return interrupted;//返回等待过程中是否被中断过,如果被中断过了,在aquire方法中就不需要自我中断了
}

//如果自己可以休息了,就通过park()方法进入waiting状态,直到被unpark()。如果不可中断的情况下被中断了,那么会从park()中醒过来,发现拿不到资源,从而继续进入park()等待。
if (shouldParkAfterFailedAcquire(p, node) &&
parkAndCheckInterrupt())
interrupted = true;//如果等待过程中被中断过,哪怕只有那么一次,就将interrupted标记为true
}
} finally {
if (failed) // 如果等待过程中没有成功获取资源(如timeout,或者可中断的情况下被中断了),那么取消节点在队列中的等待,也即取消获取资源。
cancelAcquire(node);
}
}

到这里了,再看看shouldParkAfterFailedAcquire()parkAndCheckInterrupt()具体干些什么。

shouldParkAfterFailedAcquire(Node, Node)

此方法主要用于检查自己是否真的可以去Park了(可以理解为进入等待状态,即节点去休息了)。节点什么时候可以去park呢?将它的前驱节点的waitStatus设置成SIGNAL(1)就行了,这样等前驱节点release时,会通知当前节点可以去获取资源了(unpack当前节点),然后通过acquireQueued(Node, int)中的方法,当节点将head指向了自己。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
int ws = pred.waitStatus;//拿到前驱的状态
if (ws == Node.SIGNAL)
//如果已经告诉前驱拿完号后通知自己一下,那就可以安心休息了
return true;
if (ws > 0) {
/*
* 如果前驱放弃了,那就一直往前找,直到找到最近一个正常等待的状态,并排在它的后边。
* 注意:那些放弃的结点,由于被自己“加塞”到它们前边,它们相当于形成一个无引用链,稍后就会被保安大叔赶走了(GC回收)!
*/
do {
node.prev = pred = pred.prev;
} while (pred.waitStatus > 0);
pred.next = node;
} else {
//如果前驱正常,那就把前驱的状态设置成SIGNAL,告诉它拿完号后通知自己一下。有可能失败,人家说不定刚刚释放完呢!
compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
}
return false;
}

整个流程中,如果前驱结点的状态不是SIGNAL,那么自己就不能安心去休息,又会走一遍acquireQueued(Node, int)中的自旋循环,循环时再尝试下看有没有机会轮到自己拿号。

parkAndCheckInterrupt()

当线程成功地设置了前驱节点waitStatus状态为SIGNAL,就可以安心地休息了(调用park()方法),真正进入到等待状态。

1
2
3
4
private final boolean parkAndCheckInterrupt() {
LockSupport.park(this);//调用park()使线程进入等待状态
return Thread.interrupted();//如果被唤醒,查看自己是不是被中断的。
}

线程进入等待状态后,有两种途径可以唤醒该线程:1)被unpark();2)被interrupt()。
需要注意的是,Thread.interrupted()会清除当前线程的中断标记位。

acquireQueued(Node, int)流程小结

至此,我们再回头来看acquireQueued(Node, int)的流程,可以总结为:

  1. 如果当前节点的前驱节点就是head,Name会去尝试获取资源。
  2. 获取资源失败则会尝试让自己安心地去等待。
  3. 不停的循环1、2两步,直到获取到了资源(不用阻塞,线程访问资源),或者可以安心地等待了(阻塞,等待被唤醒)。

acquire(int)流程小结

OK,现在我们可以总结出acquire(int)的整个流程了:

  1. 调用自定义同步器的tryAcquire()尝试直接去获取资源,如果成功则直接返回;
  2. 没成功,则addWaiter(Node)将该线程加入等待队列的尾部,并标记为独占模式;
  3. acquireQueued(Node, int)使线程尝试去获取资源,获取不到的话会找一个有效的前驱节点,并设置前驱节点的waiteStatus,然后就先安心休息,等被唤醒了再去获取资源。如果在整个等待过程中被中断过,方法会返回true,否则返回false。
  4. 如果线程在等待过程中被中断过,它会清除中断状态。只是获取资源后才再进行自我中断selfInterrupt(),将中断补上。


在等待队列中休息,有机会时(轮到自己,会被unpark())会去尝试获取资源。获取到资源后才返回。如果在整个等待过程中被中断过,则返回true,否则返回false。
如果线程在等待过程中被中断过,它是不响应的。只是获取资源后才再进行自我中断selfInterrupt(),将中断补上。

至此,acquire(int)的流程终于算是告一段落了。这也就是ReentrantLock.lock()的流程,不信你去看其lock()源码吧,整个函数就是一条acquire(1)。

release(int)

上一小节已经把acquire()说完了,这一小节就来讲讲它的反操作release()吧。此方法是独占模式下线程释放共享资源的顶层入口。它会释放指定量的资源,如果彻底释放了(即state=0),它会唤醒等待队列里的其他线程来获取资源。这也正是ReentrantLock.unlock()的语义,当然不仅仅只限于unlock()。下面是release()的源码:

1
2
3
4
5
6
7
8
9
public final boolean release(int arg) {
if (tryRelease(arg)) {
Node h = head;//找到头结点
if (h != null && h.waitStatus != 0)
unparkSuccessor(h);//唤醒等待队列里的下一个线程
return true;
}
return false;
}

release(int)的逻辑并不复杂。它调用tryRelease(int)来释放资源。有一点需要注意的是,它是根据tryRelease(int)的返回值来判断该线程是否已经完成释放了,所以自定义同步器在设计tryRelease(int)的时候要明确这一点!

tryRelease(int)

此方法尝试去释放指定量的资源。下面是tryRelease()的源码:

1
2
3
protected boolean tryRelease(int arg) {
throw new UnsupportedOperationException();
}

跟tryAcquire()一样,这个方法是需要独占模式的自定义同步器去实现的。正常来说,tryRelease(int)都会成功的,因为这是独占模式,该线程来释放资源,那么它肯定已经拿到独占资源了,直接减掉相应量的资源即可(state-=arg),也不需要考虑线程安全的问题。但要注意它的返回值,上面已经提到了,release(int)是根据tryRelease(int)的返回值来判断该线程是否已经完成释放掉资源了,所以自义定同步器在实现时,如果已经彻底释放资源(state=0),要返回true,否则返回false。

unparkSuccessor(Node)

此方法用于唤醒等待队列中下一个线程。下面是源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
/**
* 如果存在后继节点,唤醒后继节点
*/
private void unparkSuccessor(Node node) {
/*
* 如果头节点的waitStatus状态是负的,说明线程在等待一个信号,通过CAS操作尝试去清除这个信号等待(waitStatus置为0)。
* 这个CAS操作既是失败也没有关系,因为失败了说明已经是0了
*/
int ws = node.waitStatus;
if (ws < 0)
compareAndSetWaitStatus(node, ws, 0);

/*
* 唤醒处于等待状态中的后继节点,通常就是当前节点(头结点)的next属性指向的节点。
* 但如果next指向的节点取消了获取资源(waiteStatus=0),则从tail往前直到找到最前面那一个没有取消的节点。
*/
Node s = node.next;//找到下一个需要唤醒的结点s
if (s == null || s.waitStatus > 0) { //如果为空或已取消
s = null;
for (Node t = tail; t != null && t != node; t = t.prev) // 从后向前找。
if (t.waitStatus <= 0) //从这里可以看出,<=0的结点,都是还有效的结点。
s = t;
}
if (s != null)
LockSupport.unpark(s.thread);
}

这个函数并不复杂。一句话概括:用unpark()唤醒等待队列中最前边的那个未放弃线程,这里我们也用s来表示吧。此时,再和acquireQueued(Node, int)联系起来,s被唤醒后,进入if (p == head && tryAcquire(arg))的判断(即使p!=head也没关系,它会再进入shouldParkAfterFailedAcquire(Node, Node)方法。这里既然s已经是等待队列中最前边的那个未放弃线程了,那么通过shouldParkAfterFailedAcquire(Node, Node)的调整,s也必然会将prev属性指向head,并将head的next属性执行自己,下一次自旋p==head就成立啦),然后s把自己设置成head标杆结点,表示自己已经获取到资源了,acquire(int)也返回了!

release(int)小结

release(int)是独占模式下线程释放共享资源的顶层入口。它会释放指定量的资源,如果彻底释放了(即state=0),它会唤醒等待队列里的其他线程来获取资源。
疑问:如果当前持有资源的线程在release时异常了,没有unpark队列中的其他结点,这时队列中的其他结点会怎么办?是不是没法再被唤醒了?
确实是这样的。因为队列中等待锁的线程将永远处于park状态,无法再被唤醒!!!但是我们再回头想想,获取锁的线程在什么情形下会release抛出异常呢?

  1. 线程突然死掉了?可以通过thread.stop来停止线程的执行,但该函数的执行条件要严苛的多,而且函数注明是非线程安全的,已经标明Deprecated;
  2. 线程被interupt了?线程在运行态是不响应中断的,所以也不会抛出异常;
  3. release代码有bug,抛出异常了?目前来看,Doug Lea的release方法还是比较健壮的,没有看出能引发异常的情形(如果有,恐怕早被用户吐槽了)。除非自己写的tryRelease()有bug,那就没啥说的,自己写的bug只能自己含着泪去承受了

acquireShared(int)

此方法是共享模式下线程获取共享资源的顶层入口。它会获取指定量的资源,获取成功则直接返回,获取失败则进入等待队列,直到获取到资源为止,整个过程忽略中断。下面是acquireShared()的源码:

1
2
3
4
public final void acquireShared(int arg) {
if (tryAcquireShared(arg) < 0)
doAcquireShared(arg);
}

这里tryAcquireShared()依然需要自定义同步器去实现。但是AQS已经把其返回值的语义定义好了:负值代表获取失败;0代表获取成功,但没有剩余资源;正数表示获取成功,还有剩余资源,其他线程还可以去获取。所以这里acquireShared()的流程就是:

  1. tryAcquireShared()尝试获取资源,成功则直接返回;
  2. 失败则通过doAcquireShared()进入等待队列,直到获取到资源为止才返回。

doAcquireShared(int)

此方法用于将当前线程加入等待队列尾部休息,直到其他线程释放资源唤醒自己,自己成功拿到相应量的资源后才返回。下面是doAcquireShared()的源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
private void doAcquireShared(int arg) {
final Node node = addWaiter(Node.SHARED);//加入队列尾部
boolean failed = true;//是否成功标志
try {
boolean interrupted = false;//等待过程中是否被中断过的标志
for (;;) {
final Node p = node.predecessor();//前驱
if (p == head) {//如果到head的下一个,因为head是拿到资源的线程,此时node被唤醒,很可能是head用完资源来唤醒自己的
int r = tryAcquireShared(arg);//尝试获取资源
if (r >= 0) {//成功
setHeadAndPropagate(node, r);//将head指向自己,还有剩余资源可以再唤醒之后的线程
p.next = null; // help GC
if (interrupted)//如果等待过程中被打断过,此时将中断补上。
selfInterrupt();
failed = false;
return;
}
}

//判断状态,寻找安全点,进入waiting状态,等着被unpark()或interrupt()
if (shouldParkAfterFailedAcquire(p, node) &&
parkAndCheckInterrupt())
interrupted = true;
}
} finally {
if (failed)
cancelAcquire(node);
}
}

是不是和acquireQueued()很相似?对,其实流程并没有太大区别。只不过这里将补中断的selfInterrupt()放到doAcquireShared()里了,而独占模式是放到acquireQueued()之外,其实都一样。

独占模式比,还有一点需要注意的是,这里只有线程是head.next时(“老二”),才会去尝试获取资源,有剩余的话还会唤醒之后的队友。那么问题就来了,假如老大用完后释放了5个资源,而老二需要6个,老三需要1个,老四需要2个。老大先唤醒老二,老二一看资源不够,他是把资源让给老三呢,还是不让?答案是否定的!老二会继续park()等待其他线程释放资源,也更不会去唤醒老三和老四了。独占模式,同一时刻只有一个线程去执行,这样做未尝不可;但共享模式下,多个线程是可以同时执行的,现在因为老二的资源需求量大,而把后面量小的老三和老四也都卡住了。当然,这并不是问题,只是AQS保证严格按照入队顺序唤醒罢了(保证公平,但降低了并发)。

setHeadAndPropagate(Node, int)

1
2
3
4
5
6
7
8
9
10
private void setHeadAndPropagate(Node node, int propagate) {
Node h = head;
setHead(node);//head指向自己
//如果还有剩余量,继续唤醒下一个邻居线程
if (propagate > 0 || h == null || h.waitStatus < 0) {
Node s = node.next;
if (s == null || s.isShared())
doReleaseShared();
}
}

此方法在setHead(Node)的基础上多了一步,就是自己苏醒的同时,如果条件符合(比如还有剩余资源),还会去唤醒后继结点,毕竟是共享模式!
doReleaseShared()我们留着下面的releaseShared(int)里来讲。

acquireShared(int)小结

总结一下acquireShared(int)的流程:

  1. tryAcquireShared(int)尝试获取资源,成功则直接返回;
  2. 失败则通过doAcquireShared()进入等待队列park(),直到被unpark()/interrupt()并成功获取到资源才返回。整个等待过程也是忽略中断的。
      
    其实跟acquire()的流程大同小异,只不过多了个自己拿到资源后,还会去唤醒后继队友的操作(这才是共享嘛)

releaseShared(int)

上一小节已经把acquireShared(int)说完了,这一小节就来讲讲它的反操作releaseShared(int)吧。此方法是共享模式下线程释放共享资源的顶层入口。它会释放指定量的资源,如果成功释放且允许唤醒等待线程,它会唤醒等待队列里的其他线程来获取资源。下面是releaseShared(int)的源码:

1
2
3
4
5
6
7
public final boolean releaseShared(int arg) {
if (tryReleaseShared(arg)) {//尝试释放资源
doReleaseShared();//唤醒后继结点
return true;
}
return false;
}

此方法的流程也比较简单,一句话:释放掉资源后,唤醒后继。跟独占模式下的release()相似,但有一点稍微需要注意:独占模式下的tryRelease()在完全释放掉资源(state=0)后,才会返回true去唤醒其他线程,这主要是基于独占下可重入的考量;而共享模式下的releaseShared()则没有这种要求,共享模式实质就是控制一定量的线程并发执行,那么拥有资源的线程在释放掉部分资源时就可以唤醒后继等待结点。例如,资源总量是13,A(5)和B(7)分别获取到资源并发运行,C(4)来时只剩1个资源就需要等待。A在运行过程中释放掉2个资源量,然后tryReleaseShared(2)返回true唤醒C,C一看只有3个仍不够继续等待;随后B又释放2个,tryReleaseShared(2)返回true唤醒C,C一看有5个够自己用了,然后C就可以跟A和B一起运行。而ReentrantReadWriteLock读锁的tryReleaseShared()只有在完全释放掉资源(state=0)才返回true,所以自定义同步器可以根据需要决定tryReleaseShared()的返回值。

doReleaseShared()

此方法主要用于唤醒后继。下面是它的源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
private void doReleaseShared() {
for (;;) {
Node h = head;
if (h != null && h != tail) {
int ws = h.waitStatus;
if (ws == Node.SIGNAL) {
if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
continue;
unparkSuccessor(h);//唤醒后继
}
else if (ws == 0 &&
!compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
continue;
}
if (h == head)// head发生了变化,则会一直在循环,如果没有发生变化,则退出循环
break;
}
}

  • 自旋。每一次循环中重新读取一次head,然后保存在局部变量h中,再配合if(h == head) break;,这样,循环检测到head没有变化时就会退出循环。注意,head变化一定是因为:acquireShared(int)的线程被唤醒,并且成功获取到了资源,然后setHead设置了新head。如果head发生了变化的话,则会一直在循环。

  • if (h != null && h != tail)判断队列是否至少有两个node,如果队列从来没有初始化过(head为null),或者head就是tail,那么中间逻辑直接不走,直接判断head是否变化了。

  • 如果队列中有两个或以上个node,那么检查局部变量h的状态:

    • 如果状态为SIGNAL,说明h的后继是需要被通知的。通过对CAS操作结果取反,将compareAndSetWaitStatus(h, Node.SIGNAL, 0)unparkSuccessor(h)绑定在了一起。说明了只要head成功得从SIGNAL修改为0,那么head后继节点所的代表线程就会被唤醒了。
    • 如果状态为0,说明h的后继所代表的线程已经被唤醒或即将被唤醒,并且这个中间状态即将消失,要么由于acquire thread获取锁失败再次设置head为SIGNAL并再次阻塞,要么由于acquire thread获取锁成功而将自己(head后继)设置为新head并且只要head后继不是队尾,那么新head肯定为SIGNAL。所以设置这种中间状态的head的status为PROPAGATE,让其status又变成负数,这样可能被被唤醒线程检测到。
    • 如果状态为PROPAGATE,直接判断head是否变化。
  • 两个continue保证了进入那两个分支后,只有当CAS操作成功后,才可能去执行if(h == head) break;,才可能退出循环。

  • if(h == head) break;保证了,只要在某个循环的过程中有线程刚获取了锁且设置了新head,就会再次循环。目的当然是为了再次执行unparkSuccessor(h),即唤醒队列中第一个等待的线程。

------ 本文完 ------