我正在Linux上开发一个应用程序,我想以某个特定频率回溯所有正在运行的线程。因此,我的用户定义的信号处理程序SIGUSR1(针对所有线程)调用backtrace()。
我在信号处理程序中遇到崩溃(SIGSEGV),该信号处理程序源自backtrace()调用。我已经将正确的参数传递给了大多数网站上指定的函数。
http://linux.die.net/man/3/backtrace。
在这种情况下会使backtrace()崩溃的原因是什么?
要添加更多详细信息:
是什么让我得出结论,崩溃位于回溯内,位于下面的第14帧。 onMySignal是信号处理程序SIGUSR1,它调用backtrace。
是onMySignal的示例代码(从backtrace的Linux文档复制)
pthread_mutex_lock( &sig_mutex );
int j, nptrs;
#define SIZE 100
void *buffer[100] = {NULL};//or void *buffer[100];
char **strings;
nptrs = backtrace(buffer, SIZE);
pthread_mutex_unlock( &sig_mutex );
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaabda936b2 in skgesigOSCrash () from
#2 0x00002aaabdd31705 in kpeDbgSignalHandler ()
#3 0x00002aaabda938c2 in skgesig_sigactionHandler ()
#4 <signal handler called>
#5 0x00000037ba030265 in raise () from
#6 0x00000037ba031d10 in abort () from
#7 0x00002b6cef82efd7 in os::abort(bool) () from
#8 0x00002b6cef98205d in VMError::report_and_die() ()
#9 0x00002b6cef835655 in JVM_handle_linux_signal ()
#10 0x00002b6cef831bae in signalHandler(int, siginfo*, void*) ()
#11 <signal handler called>
#12 0x00000037be407638 in ?? ()
#13 0x00000037be4088bb in _Unwind_Backtrace ()
#14 0x00000037ba0e5fa8 in backtrace ()
#15 0x00002aaaaae3875f in onMySignal (signum=10,info=0x4088ec80, context=0x4088eb50)
#16 <signal handler called>
#17 0x00002aaab4aa8acb in mxSession::setPartition(int)
#18 0x0000000000000001 in ?? ()
#19 0x0000000000000000 in ?? ()
(gdb)
希望这将使问题变得更清楚。
@janneb
我已经在Mutex锁中编写了信号处理程序实现,以实现更好的同步。
@janneb
我在文档中找不到指定API backtrace_symbols/backtrace是否为async_signal_safe的文件。以及是否应在信号处理程序中使用它们。
我仍然从我的信号处理程序中删除了backtrace_symbols,并且不在任何地方使用它。也不知道为什么它崩溃了..
编辑23/06/11:更多详细信息:
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaab98a36b2 in skgesigOSCrash () from
#2 0x00002aaab9b41705 in kpeDbgSignalHandler () from
#3 0x00002aaab98a38c2 in skgesig_sigactionHandler () from
#4 <signal handler called>
#5 0x00000037ba030265 in raise () from
#6 0x00000037ba031d10 in abort () from
#7 0x00002ac003803fd7 in os::abort(bool) () from
#8 0x00002ac00395705d in VMError::report_and_die() () from
#9 0x00002ac00380a655 in JVM_handle_linux_signal () from
#10 0x00002ac003806bae in signalHandler(int, siginfo*, void*) () from
#11 <signal handler called>
#12 0x00000037be407638 in ?? () from libgcc_s.so.1
#13 0x00000037be4088bb in _Unwind_Backtrace () from libgcc_s.so.1
#14 0x00000037ba0e5fa8 in backtrace () from libc.so.6
#15 0x00002aaaaae3875f in onMyBacktrace (signum=10, info=0x415d0eb0, context=0x415d0d80)
#16 <signal handler called>
#17 0x00000037ba071fa8 in _int_free () from libc.so.6
#18 0x00000000000007e0 in ?? ()
#19 0x000000005aab01a0 in ?? ()
#20 0x000000000000006f in ?? ()
#21 0x00000037ba075292 in realloc () from libc.so.6
#22 0x00002aaab6248c4e in Memory::reallocMemory(void*, unsigned long, char const*, int) ()
执行realloc时发生崩溃,该地址之一类似于0x00000000000007e0(看起来无效)。
最佳答案
documentation for signal handling
定义了要从信号处理程序调用的安全函数的列表,您不得使用任何其他函数,包括backtrace
。 (在该文档中搜索async-signal-safe
)
您可以做的是将write
编码到先前设置的管道,并让一个线程等待该管道,然后执行回溯。
编辑:
好的,因此backtrace
函数返回当前线程的堆栈,因此不能从另一个线程使用它,因此我使用单独的线程进行回溯的想法行不通。
因此:您可以从信号处理程序中尝试backtrace_symbols_fd
。
或者,您可以使用gdb
来获取回溯信息,而不必在程序中包含代码-gdb
可以轻松处理多个线程。
Shell脚本运行gdb并获取跟踪:
#!/bin/bash
PID="$1"
[ -d "/proc/$PID" ] || PID=$(pgrep $1)
[ -d "/proc/$PID" ] || { echo "Can't find process: $PID" >&2 ; exit 1 ; }
[ -d "$TMPDIR" ] || TMPDIR=/tmp
BATCH=$(mktemp $TMPDIR/pstack.gdb.XXXXXXXXXXXXX)
echo "thread apply all bt" >"$BATCH"
echo "quit" >>"$BATCH"
gdb "/proc/$PID/exe" "$PID" -batch -x "$BATCH" </dev/null
rm "$BATCH"
关于linux - 是什么在Linux 64位上使backtrace()崩溃(SIGSEGV),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6371028/