我有一个没有响应的应用程序,似乎处于死锁或类似死锁的状态。请参阅下面的两个线程。注意,My-Thread@101c
线程阻止了AWT-EventQueue-0@301
。但是,My-Thread
刚刚称为java.awt.EventQueue.invokeAndWait()
。因此,AWT-EventQueue-0
阻止My-Thread
(我相信)。
My-Thread@101c, priority=5, in group 'main', status: 'WAIT'
blocks AWT-EventQueue-0@301
at java.lang.Object.wait(Object.java:-1)
at java.lang.Object.wait(Object.java:485)
at java.awt.EventQueue.invokeAndWait(Unknown Source:-1)
at javax.swing.SwingUtilities.invokeAndWait(Unknown Source:-1)
at com.acme.ui.ViewBuilder.renderOnEDT(ViewBuilder.java:157)
.
.
.
at com.acme.util.Job.run(Job.java:425)
at java.lang.Thread.run(Unknown Source:-1)
AWT-EventQueue-0@301, priority=6, in group 'main', status: 'MONITOR'
waiting for My-Thread@101c
at com.acme.persistence.TransactionalSystemImpl.executeImpl(TransactionalSystemImpl.java:134)
.
.
.
at com.acme.ui.components.MyTextAreaComponent$MyDocumentListener.insertUpdate(MyTextAreaComponent.java:916)
at javax.swing.text.AbstractDocument.fireInsertUpdate(Unknown Source:-1)
at javax.swing.text.AbstractDocument.handleInsertString(Unknown Source:-1)
at javax.swing.text.AbstractDocument$DefaultFilterBypass.replace(Unknown Source:-1)
at javax.swing.text.DocumentFilter.replace(Unknown Source:-1)
at com.acme.ui.components.FilteredDocument$InputDocumentFilter.replace(FilteredDocument.java:204)
at javax.swing.text.AbstractDocument.replace(Unknown Source:-1)
at javax.swing.text.JTextComponent.replaceSelection(Unknown Source:-1)
at javax.swing.text.DefaultEditorKit$DefaultKeyTypedAction.actionPerformed(Unknown Source:-1)
at javax.swing.SwingUtilities.notifyAction(Unknown Source:-1)
at javax.swing.JComponent.processKeyBinding(Unknown Source:-1)
at javax.swing.JComponent.processKeyBindings(Unknown Source:-1)
at javax.swing.JComponent.processKeyEvent(Unknown Source:-1)
at java.awt.Component.processEvent(Unknown Source:-1)
at java.awt.Container.processEvent(Unknown Source:-1)
at java.awt.Component.dispatchEventImpl(Unknown Source:-1)
at java.awt.Container.dispatchEventImpl(Unknown Source:-1)
at java.awt.Component.dispatchEvent(Unknown Source:-1)
at java.awt.KeyboardFocusManager.redispatchEvent(Unknown Source:-1)
at java.awt.DefaultKeyboardFocusManager.dispatchKeyEvent(Unknown Source:-1)
at java.awt.DefaultKeyboardFocusManager.preDispatchKeyEvent(Unknown Source:-1)
at java.awt.DefaultKeyboardFocusManager.typeAheadAssertions(Unknown Source:-1)
at java.awt.DefaultKeyboardFocusManager.dispatchEvent(Unknown Source:-1)
at java.awt.Component.dispatchEventImpl(Unknown Source:-1)
at java.awt.Container.dispatchEventImpl(Unknown Source:-1)
at java.awt.Window.dispatchEventImpl(Unknown Source:-1)
at java.awt.Component.dispatchEvent(Unknown Source:-1)
at java.awt.EventQueue.dispatchEvent(Unknown Source:-1)
at java.awt.EventDispatchThread.pumpOneEventForFilters(Unknown Source:-1)
at java.awt.EventDispatchThread.pumpEventsForFilter(Unknown Source:-1)
at java.awt.EventDispatchThread.pumpEventsForHierarchy(Unknown Source:-1)
at java.awt.EventDispatchThread.pumpEvents(Unknown Source:-1)
at java.awt.EventDispatchThread.pumpEvents(Unknown Source:-1)
at java.awt.EventDispatchThread.run(Unknown Source:-1)
这是
TransactionalSystemImpl.executeImpl
方法:private synchronized Object executeImpl(Transaction xact, boolean commit) {
final Object result;
try {
if (commit) { // this is line 134
clock.latch();
synchronized(pendingEntries) {
if (xactLatchCount > 0) {
pendingEntries.add(xact);
} else {
xactLog.write(new TransactionEntry(xact, clock.time()));
}
}
}
final TransactionExecutor executor = transactionExecutorFactory.create(
xact.getClass().getSimpleName()
);
if (executor == null) {
throw new IllegalStateException("Failed to create transaction executor for transaction: " + xact.getClass().getName());
}
result = executor.execute(xact);
} finally {
if (commit) clock.unlatch();
}
return result;
}
有谁知道这里发生了什么或如何解决?
最佳答案
在我认识的Swing开发人员中,众所周知invokeAndWait
是有问题的,但这也许不像我想象的那样广为人知。我似乎回想起在文档中看到关于正确使用invokeAndWait
的困难的严厉警告,但是我很难找到任何东西。我在当前的官方文档中找不到任何内容。我唯一能找到的是Swing Tutorial from 2005的旧版本中的这一行:(网络存档)
不幸的是,该行似乎已从当前的Swing教程中消失。即使这样,还是轻描淡写。我本来希望这样说,“如果您使用invokeAndWait
,那么调用invokeAndWait
的线程一定不能持有其他线程在调用发生时可能需要的任何锁。”通常,很难知道在任何给定时间内其他线程可能需要什么锁,最安全的策略可能是确保调用invokeAndWait
的线程在所有上都不持有任何锁。
(这很难做到,这就是为什么我在上面说invokeAndWait
是有问题的。我还知道JavaFX的设计者(本质上是Swing的替代品)在javafx.application.Platform类中定义了一种称为runLater
的方法,该方法在功能上等效于invokeLater
但他们故意省略了invokeAndWait
的等效方法,因为很难正确使用。)
从第一原理中得出的理由很简单。考虑一个与OP描述的系统类似的系统,它具有两个线程:MyThread和Event Dispatch Thread(EDT)。 MyThread锁定对象L,然后调用invokeAndWait
。这将发布事件E1,并等待EDT处理它。假设E1的处理程序需要锁定L。当EDT处理事件E1时,它将尝试对L进行锁定。该锁已由MyThread持有,它直到EDT处理E1才会放弃它,但是该处理被阻止了通过MyThread。因此,我们陷入僵局。
这是这种情况的变体。假设我们确保处理E1不需要锁定L。这样安全吗?否。如果在MyThread调用invokeAndWait
之前,将事件E0发布到事件队列中,并且E0的处理程序需要锁定L,则仍然会发生问题。像以前一样,MyThread持有L的锁定,因此将阻止E0的处理。 E1在事件队列中位于E0后面,因此E1的处理也被阻止。由于MyThread正在等待E1的处理,并且被E0阻塞,而E0又被阻塞,等待MyThread放弃对L的锁定,因此我们再次遇到了死锁。
这听起来与OP应用程序中的操作非常相似。根据OP对this answer的评论,
我们没有完整的图片,但这可能足以继续下去。从MyThread调用renderOnEDT
,当它在invokeAndWait
中被阻止时,该线程将锁定某个内容。它正在等待EDT处理事件,但是我们可以看到EDT在MyThread持有的东西上被阻止了。我们不能确切地说出它是哪个对象,但这没关系-EDT显然在MyThread持有的锁上被阻塞,而MyThread显然在等待EDT处理事件:因此,死锁。
还要注意,我们可以相当肯定地确定EDT当前未处理invokeAndWait
发布的事件(类似于上述情况中的E1)。如果是这样,则每次都会发生死锁。根据OP对this answer的评论,它似乎仅在某些情况下发生,当用户快速键入时。因此,我敢打赌,EDT当前正在处理的事件是一个按键,在MyThread锁定之后但在MyThread调用invokeAndWait
将E1发布到事件队列之前,该事件恰好发布到了事件队列中,因此类似于E0在上述情况下。
到目前为止,这可能主要是问题的重述,它与其他答案以及OP对这些答案的评论汇总在一起。在继续讨论解决方案之前,以下是我对OP应用程序所做的一些假设:
invokeAndWait
更改为invokeLater
。 OP表示这样做会导致其他问题。这并不奇怪,因为更改会导致执行以不同的顺序进行,因此会产生不同的结果。我认为它们是 Not Acceptable 。 如果我们无法删除锁,也无法更改为
invokeLater
,那么我们就可以安全地调用invokeAndWait
了。 “安全”是指在调用之前放弃锁。考虑到OP应用程序的组织,这可能很难做到,但是我认为这是唯一的方法。让我们看看MyThread在做什么。这被大大简化了,因为可能在堆栈上有很多中间方法调用,但是从根本上来说是这样的:
synchronized (someObject) {
// code block 1
SwingUtilities.invokeAndWait(handler);
// code block 2
}
当某个事件在处理程序前面的队列中潜行时,就会发生问题,并且该事件的处理需要锁定
someObject
。我们如何避免这个问题?您不能在synchronized
块内放弃Java的内置监视器锁之一,因此必须关闭该块,进行调用,然后再次打开它:synchronized (someObject) {
// code block 1
}
SwingUtilities.invokeAndWait(handler);
synchronized (someObject) {
// code block 2
}
如果对
someObject
的锁定距离对invokeAndWait
的调用的调用栈相当远,这可能会很困难,但我认为这样做是不可避免的。还有其他陷阱。如果代码块2依赖于代码块1加载的某个状态,则在代码块2再次获得锁定时,该状态可能已过时。这意味着代码块2必须从同步对象中重新加载任何状态。它不能基于代码块1的结果进行任何假设,因为这些结果可能已过时。
这是另一个问题。假设由
invokeAndWait
运行的处理程序需要从共享库中加载某些状态,例如,synchronized (someObject) {
// code block 1
SwingUtilities.invokeAndWait(handler(state1, state2));
// code block 2
}
您不能仅将
invokeAndWait
调用从同步块(synchronized block)中迁移出来,因为这将需要进行状态1和状态2的非同步访问。相反,您要做的是在锁定内将此状态加载到局部变量中,然后在释放锁定后使用这些局部变量进行调用。就像是:int localState1;
String localState2;
synchronized (someObject) {
// code block 1
localState1 = state1;
localState2 = state2;
}
SwingUtilities.invokeAndWait(handler(localState1, localState2));
synchronized (someObject) {
// code block 2
}
释放锁定后进行 call 的技术称为开放 call 技术。请参见Doug Lea,《 Java中的并发编程》(第二版),第2.4.1.3节。 Goetz等人也对该技术进行了很好的讨论。等,《 Java Concurrency in Practice》,第10.1.4节。实际上,第10.1节中的所有内容都相当彻底地涵盖了僵局。我强烈推荐。
总而言之,我相信使用我上面描述的技术或引用的书中的技术,可以正确,安全地解决此死锁问题。但是,我确信这将需要大量的仔分割析和困难的重组。不过,我没有其他选择。
(最后,我应该说,尽管我是Oracle的雇员,但这绝不是Oracle的正式声明。)
更新
我想到了更多可能有助于解决问题的重构方法。让我们重新考虑代码的原始架构:
synchronized (someObject) {
// code block 1
SwingUtilities.invokeAndWait(handler);
// code block 2
}
这将按顺序执行代码块1,处理程序和代码块2。如果我们将
invokeAndWait
调用更改为invokeLater
,则该处理程序将在代码块2之后执行。人们可以很容易地看到这对于应用程序是一个问题。相反,我们如何将代码块2移到invokeAndWait
中,以便它以正确的顺序执行,但仍在事件线程上执行?synchronized (someObject) {
// code block 1
}
SwingUtilities.invokeAndWait(Runnable {
synchronized (someObject) {
handler();
// code block 2
}
});
这是另一种方法。我不完全知道传递给
invokeAndWait
的处理程序打算做什么。但是,可能需要使用invokeAndWait
的原因之一是它从GUI中读取了一些信息,然后使用它来更新共享状态。这必须在EDT上,因为它与GUI对象进行交互,并且invokeLater
不能使用,因为它以错误的顺序发生。这建议在执行其他处理之前调用invokeAndWait
,以便将信息从GUI中读取到临时区域中,然后使用该临时区域执行连续处理:TempState tempState;
SwingUtilities.invokeAndWait(Runnable() {
synchronized (someObject) {
handler();
tempState.update();
}
);
synchronized (someObject) {
// code block 1
// instead of invokeAndWait, use tempState from above
// code block 2
}