听说你想学Java并发编程？先把这个学了(2)--20210604-工具盒子

大家好，我是指北君。

俗话说，铁要趁热打，指北君在写完AQS第一篇文章后，就马不停蹄的输出第二篇了，这篇主要是讲AQS是如何解决互斥问题的，如果没看过AQS系列第一篇的童鞋，建议先把第一篇看完，它是后面两篇的基础。

说到互斥，我们第一个反应是什么？锁！对，AQS就是利用的锁来解决互斥的，那我们就来看看AQS是如何实现这个锁的。

AQS提供了两种锁，独占锁和共享锁。独占锁只有一把锁，同一时间只允许一个线程获得锁；而共享锁则有多把锁，同一时间允许多个线程获得锁。我们本文主要讲独占锁。

一. 独占锁的获取 {#一-独占锁的获取}

AQS中对独占锁的获取一共有三个方法：

acquire：不响应中断获取独占锁
acquireInterruptibly：响应中断获取独占锁
tryAcquireNanos：响应中断+超时获取独占锁

由于篇幅，我们主要着眼于acquire方法，当然，只要你理解了acquire，acquireInterruptibly和tryAcquireNanos自然不在话下了，因为这两个方法只是在acquire的基础上增加了一些判断逻辑来处理中断和超时情况而已。

我们上源码

|-------------------|--------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 | public final void acquire(int arg) { if (!tryAcquire(arg) && acquireQueued(addWaiter(Node.EXCLUSIVE), arg)) selfInterrupt(); } |

其acquire方法中一共有四个方法，其逻辑也分为4步：

tryAcquire：尝试获取锁，成功即acquire方法结束，否则调用addWaiter
addWaiter：获取锁失败即调用此方法入队，即将获取锁失败的线程包装成Node放入同步队列的队尾
acquireQueued：入队成功后即调用此方法，如果Node在队首则再次抢锁，否则挂起等待唤醒（唤醒后再去获取锁）
selfInterrupt：如果是被中断唤醒，则再次执行中断

粗略介绍完后，我们现在一个一个方法看。

1.1 tryAcquire {#11-tryacquire}

|---------------|--------------------------------------------------------------------------------------| | 1 2 3 | protected boolean tryAcquire(int arg) { throw new UnsupportedOperationException(); } |

tryAcquire是钩子方法，是我们根据需要重写的。其功能就是在独占模式下去获取锁，获取成功则返回true，acquire方法直接结束；如果获取失败返回false，则后续会调用后面要讲的addWaiter方法将线程入队。

因为AQS是模板类，不同的子类只需要重写不同的钩子方法，因此，tryAcquire不能设置成抽象方法，不然一些不需要此钩子方法的子类也要实现这个方法。所以作者对tryAcquire的默认实现是抛了一个异常（当然我认为直接写个return也是ok的）。

1.2 addWaiter {#12--addwaiter}

如果tryAcquire获取锁失败后，我们就会调用addWaiter将线程包装成Node入队挂起。addWaiter的大致逻辑是：先将线程包装成Node，然后入队，如果队列未初始化或者入队失败，则会调用子方法enq，enq来进行初始化队列和自旋入队，我们看下具体代码：

下面是enq方法，当执行到这个方法时，说明线程获取锁已经失败了，然后入队过程又失败了，入队过程失败有两个原因：

同步队列未初始化
入队过程中CAS操作失败

|---------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | private Node enq(final Node node) { for (;;) { Node t = tail; // 队列为空, 初始化队列操作，即将head和tail指向一个空节点 if (t == null) { if (compareAndSetHead(new Node())) tail = head; } else { // 队列不为空 // 并发下，cas操作可能会失败，所以通过for循环不断进行入队，直到成功为止 node.prev = t; if (compareAndSetTail(t, node)) { t.next = node; return t; } } } } |

CAS节点入队失败的原因，我们看到enq源码中执行完尾插法的步骤一，即将Node的前驱指针指向当前尾结点，如果是并发情况下，应该是如下图所示（紫色节点代表我们关注的Node）：

MESA Monitor

此时，可能有多个Node都准备入队，所以此时可能有多个Node的前驱节点都指向尾结点，所以我们在执行步骤二将尾结点指向Node时，采用的是CAS，即只有一个Node能成功，假设我们关注的Node入队成功了，如下图：

MESA Monitor

则另外两个CAS操作肯定会失败，即它们将要进入enq方法重新自旋入队。

1.3 acquireQueued {#13--acquirequeued}

执行完addWaiter方法后，说明我们已经入队成功了，此时我们需要将Node中的线程挂起，等待下次被唤醒。

但在挂起之前，我们需要再次检查下我们此时的Node是否是在队首，如果在队首，我们又会再次去抢锁。否则我们会通过shouldParkAfterFailedAcquire判断是否要挂起（shouldParkAfterFailedAcquire不仅仅是判断此线程是否可以被挂起，还会将同步队列中属性为CANCELLED的Node移除队列），如果需要挂起，则调用parkAndCheckInterrupt将线程挂起。具体源码如下：

|---------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | final boolean acquireQueued(final Node node, int arg) { // 获取失败标签，默认ture，如果获取到锁了后则会置为false boolean failed = true; try { // 中断标签，默认false boolean interrupted = false; for (;;) { // 获取此节点的前驱节点 final Node p = node.predecessor(); // 如果前驱节点是头结点,则会再次调用tryAcquire抢锁 // 如果抢锁成功了，则进入if语句，然后return if (p == head && tryAcquire(arg)) { // 将此节点设置为头结点 setHead(node); p.next = null; // help GC // 获取失败标志置为false,因为拿到锁了 failed = false; // 返回中断标志 return interrupted; } // shouldParkAfterFailedAcquire判断是否要挂起 // 如果要挂起，则调用parkAndCheckInterrupt将线程挂起 if (shouldParkAfterFailedAcquire(p, node) && parkAndCheckInterrupt()) interrupted = true; } } finally { if (failed) cancelAcquire(node); } } |

shouldParkAfterFailedAcquire源码如下。其主要作用有2：

决定获取锁失败后，是否将线程挂起
清除同步队列中所有状态为CANCELLED的节点

|---------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) { int ws = pred.waitStatus; // 如果此节点的前驱节点为SIGNAL,则说明此节点需要挂起，返回true if (ws == Node.SIGNAL) return true; // 如果此节点的前驱节点状态大于0，即状态为CANCELLED则移除前驱节点，然后再往前遍历，直到清除完所有CANCELLED的节点 if (ws > 0) { do { node.prev = pred = pred.prev; } while (pred.waitStatus > 0); pred.next = node; } else { // 将前驱节点置为SIGNAL compareAndSetWaitStatus(pred, ws, Node.SIGNAL); } return false; } |

这是acquireQueued中的最后一步，即将线程挂起，然后静静的等待被唤醒。除非该线程被其他线程unpark或者被中断，否则该线程的程序将一直停止在这。

|---------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 | private final boolean parkAndCheckInterrupt() { // 通过LockSupport挂起线程 LockSupport.park(this); // 返回线程的标志位，true表示此线程被中断过 return Thread.interrupted(); } |

1.4 selfInterrupt {#14-selfinterrupt}

通过我们前面的分析可以知道，当线程被中断过，则会进入到此方法。

而interrupte这个方法也只是将当前线程的中断标志置为true，至于会不会被中断，这个是由系统决定的。

|---------------|---------------------------------------------------------------------| | 1 2 3 | static void selfInterrupt() { Thread.currentThread().interrupt(); } |

二. 独占锁的的释放 {#二-独占锁的的释放}

相比独占锁的获取，独占锁的释放逻辑就简单多了。独占锁释放只做了两件事情：

释放锁
唤醒head结点后最近需要被唤醒的节点。

其释放逻辑的实现是通过release方法，而做的两件事分别对应了其子方法tryRelease和unparkSuccessor：

|---------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 7 8 9 10 11 12 13 | public final boolean release(int arg) { // 如果释放锁成功，则进入if去唤醒同步队列中的线程 if (tryRelease(arg)) { Node h = head; // head节点不为空(即同步队列不为空) 且状态不为0(初始化队列时，head结点waitStatus为0，此时等待队列中是没有节点的) // 则唤醒head结点后继节点 if (h != null && h.waitStatus != 0) // 唤醒离head最近需要被唤醒的节点 unparkSuccessor(h); return true; } return false; } |

2.1 tryRelease {#21-tryrelease}

这个方法和tryAcquire一样，也是钩子方法，是留给子类重写的，作用是用来释放锁，如果释放成功则返回true，失败返回false，这个具体的实现我们也放在后续AQS的子类中讲解，这里就不过多阐述了。

2.2 unparkSuccessor {#22-unparksuccessor}

此方法的作用是唤醒后继Node，我们看代码：

|---------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | private void unparkSuccessor(Node node) { int ws = node.waitStatus; // waitStatus<0，说明此时waitStatus为SIGNAL if (ws < 0) // 此时需要将waitStatus置为0，待会唤醒后继节点 compareAndSetWaitStatus(node, ws, 0); Node s = node.next; // 此Node的后继节点如果是null或者状态为CANCELLED，则此Node已经不存在或者取消 // 则我们需要从尾结点往前遍历找到离head最近的需要被唤醒的Node if (s == null || s.waitStatus > 0) { s = null; for (Node t = tail; t != null && t != node; t = t.prev) if (t.waitStatus <= 0) s = t; } if (s != null) // 唤醒Node中的线程 LockSupport.unpark(s.thread); } |

这里需要注意的是，我们在找需要被唤醒的节点时，为什么是从后往前遍历呢？

其实这和获取锁时的尾结点入队有关，我们再看下入队方法addWaiter中插入尾结点的相关代码：

|---------------|-------------------------------------------------------------------------------------------------------| | 1 2 3 | node.prev = pred; //step1 if (compareAndSetTail(pred, node)) // step2 pred.next = node; // step3 |

假设我们此时有个Node正在入队，执行完step2，还未执行step3，unparkSuccessor中如果采用从head往后遍历，是找不到这个新插入的Node的；但如果是采用从后往前遍历，则不会出现这个问题。

三. 总结 {#三-总结}

对于独占锁的获取与释放，指北君就分析完了，这里我再总结一下：

获取独占锁是通过acquire来实现的，首先通过tryAcquire获取锁，如果获取成功，则直接返回，如果失败，则会调用addWaiter方法进行入队，如果入队过程中发现队列未初始化，则会初始化队列再进行入队，入队不成功则会一直自旋直到成功；入队成功后就会挂起，直到被其他线程或者中断唤醒；唤醒后会检查线程的中断标志位，如果被中断过，会再次调用中断方法，告诉系统自己需要被中断。

释放独占锁是通过release方法实现的，其首先通过tryRelease释放锁，如果失败则直接返回false，如果成功则会调用unparkSuccessor唤醒后继节点。

通过上面的分析，大家应该了解了AQS是如何解决互斥问题的。后面指北君将会讨论AQS如何解决线程间通信协作问题，敬请期待~