我们有一个独立的VC++应用程序,并使用log4cxx0.10.0版本添加了日志记录。
应用程序将启动一个线程(用于一些耗时的操作),如果花费的时间超过阈值时间,则主线程将使用TerminateThread方法杀死该线程。子线程功能还具有一些日志记录打印功能.Log4CXX配置了滚动文件附加器,大小为1 MB,包含5个备份副本。在大多数情况下,日志记录都可以正常工作。但是在某些情况下,主线程日志记录函数调用在杀死子线程后挂起,因此整个应用程序处于挂起状态。
该应用程序的后续实例也被挂起。我们获取了应用程序的完整崩溃转储,并使用WinDbg进行了分析。

这是应用程序的调用堆栈

**00 ntdll!NtWaitForSingleObject+0xa
01 ntdll!RtlpWaitOnCriticalSection+0xe8
02 ntdll!RtlEnterCriticalSection+0xd1
03 log4cxx!log4cxx::filter::DenyAllFilter::decide+0x194
04 log4cxx!log4cxx::helpers::synchronized::synchronized+0x31
05 log4cxx!log4cxx::Logger::callAppenders+0x81
06 log4cxx!log4cxx::Logger::forcedLog+0xe5**
07 Test!CXX_LOG(int LOG_TYPE = 0n2, char * format = 0x00000001`3f2a2ad8 "Main thread pint...")+0x463 [d:\test\saf\test.cpp @ 2360]
08 test!TestFunction(int argc = 0n3, char ** argv = 0x00000001`3f2ae880, int level = 0n1)+0x586 [d:\test\saf\test.cpp @ 1634]
09 test!main(int argc = 0n4, char ** argv = 0x00000000`00282920)+0x1820 [d:\test\saf\test.cpp @ 2309]
0a test!__tmainCRTStartup(void)+0x13b [f:\dd\vctools\crt_bld\self_64_amd64\crt\src\crt0.c @ 278]
0b kernel32!BaseThreadInitThunk+0xd
0c ntdll!RtlUserThreadStart+0x1d

和随后的应用程序挂起,以锁定实例的文件和调用堆栈,如下所示
**ntdll!ZwLockFile+0xa
KERNELBASE!LockFileEx+0xb2
kernel32!LockFileEx+0x1b
log4cxx!log4cxx::filter::DenyAllFilter::decide+0x2a89
log4cxx!log4cxx::helpers::DatagramPacket::setData+0x559c
log4cxx!log4cxx::helpers::FileOutputStream::write+0x82
log4cxx!log4cxx::rolling::RollingFileAppenderSkeleton::getTriggeringPolicy+0x1ca
log4cxx!log4cxx::helpers::OutputStreamWriter::write+0xbe
log4cxx!log4cxx::WriterAppender::subAppend+0x7c
log4cxx!log4cxx::rolling::RollingFileAppenderSkeleton::subAppend+0xd0
log4cxx!log4cxx::WriterAppender::append+0x31
log4cxx!log4cxx::AppenderSkeleton::doAppend+0x293
log4cxx!log4cxx::helpers::AppenderAttachableImpl::appendLoopOnAppenders+0x40
log4cxx!log4cxx::Logger::callAppenders+0xa3
log4cxx!log4cxx::Logger::forcedLog+0xe5**
test!CXX_LOG(int LOG_TYPE = 0n2, char * format = 0x00000001`3f2a3868 "Starting the application")+0x463
test!main(int argc = 0n4, char ** argv = 0x00000000`00162920)+0x1806
test!__tmainCRTStartup(void)+0x13b
kernel32!BaseThreadInitThunk+0xd
ntdll!RtlUserThreadStart+0x21

我们已经检查了'decide'函数,它与锁定无关。它只是返回一些常量值。我已经知道LOG4CXX是线程安全的。这个问题不会经常发生,因此我们没有步骤以一致的方式进行复制。

当我们杀死子线程时,有什么需要解决的吗?

最佳答案

重新设计您的应用程序。 TerminateThread本质上是隐式不安全的,因为不会释放线程使用的资源。您只是设法在它持有锁的同时终止了它,现在您的主线程正在尝试获取该持有的锁。查找终止线程的另一种方法。

这是该堆栈跟踪中的锁:https://apache.googlesource.com/log4cxx/+/e3db59080a3506f0ed23e98cbcb2be58f0b15a20/src/main/cpp/logger.cpp#93

07-28 01:33