我有一个运行Linux的Zynq UltraScale MPSoC,上面有一个四核ARM Cortex。有时,会发生生成SIGBUS错误的事件。下面是调试分析的一个片段。我确信dst和src的值在合法的区域内。实际访问本身是一个从fpga内存资源到内部arm内存位置的复制例程。
我在另一篇文章中读到sigbus-in的原因可能是i/o失败。有谁能解释一下“I/O故障”与ARM的关系吗?我想,有点类似于一个失败的总线确认。
相对于一个ARM皮层,是否有一个等效于机器检查寄存器的寄存器,可以进一步深入了解SIGBUS的原因?

#0 ecfm_copy_table_entry_backward (dst=dst@entry=0xee189830, src=<optimized out>, num_words=num_words@entry=72) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:478
#1 0xf658347c in ecfm_copy_table_entry_backward (num_words=72, src=<optimized out>, dst=0xee189830) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:1186
#2 ecfm_get_rx_stats (session_id=session_id@entry=2637, stat=stat@entry=0xee189830) at src/software/saos-sds/ecfm_driver/ecfm_driver.c:1185
#3 0x011c463c in eCfmApiGetRxProcessingStats (sessionId=<optimized out>, stat=0xee1898e0) at src/software/saos-sds/leos/platform/common/src/eCfmApi.c:1836
#4 0x011d6aac in halFPGAGetStats (pPlatformData=pPlatformData@entry=0xe7f98abc, lossStats=0xee1899a8, lossStats@entry=0xee1899a0)
at src/software/saos-sds/leos/platform/common/src/halEcfmFpgaApi.c:2214
#5 0x00a71870 in cfmAgentReadHwStats (data=0xe7f98a70, role=<optimized out>, testType=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:1760
#6 0x009fd39c in cfmTestSessionSmiSmEvent (pSession=0xe7f98a70, event=event@entry=CfmTestSmiEvent_DeltaTComplete)
at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfm.c:26242
#7 0x00a75f04 in cfmApalOamFpgaSessionStatusIntHdlr (context=<optimized out>, pMsg=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:2461
#8 cfmApalOamFpgaHalY1731IntHdlr (context=<optimized out>, pMsg=0x37b7768 <__func__.44940>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:2548
#9 0x00a7cf04 in oamMsgDispatchMsgList (msgList=msgList@entry=0x68dfae8, pMsgContext=pMsgContext@entry=0xee189bc8)
at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/oamMsg.c:92
#10 0x00a76e50 in cfmHalDispatchMsgList (cpe=<optimized out>, msgList=msgList@entry=0x68dfae8) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmApal.c:594
#11 0x00a8f2cc in CfmAgentMsgHdlr (sig=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1335
#12 0x00a9045c in cfmAgentTmoHdlr (cycle=<optimized out>, extraProcTimeMs=0) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1383
#13 0x00a90598 in cfmAgentMain (arg=<optimized out>) at src/software/saos-sds/leos/common/src/genericSwitch/cfm/src/cfmAgent.c:1441
#14 0x0112ea8c in thread_prologue (arg=<optimized out>) at src/software/saos-sds/leos/os/linux/src/ose_shim.c:1273
#15 0xf704af8c in start_thread (arg=0xee18a3e0) at pthread_create.c:335
#16 0xf646b0a0 in ?? () at ../sysdeps/unix/sysv/linux/arm/clone.S:89
from /localdata/perforce/ankgoyal/oneos/branches/saos-sds/dev/main/build/saos-sds/fs/eredan_tarfs/debug/eredan/armv7a/lib/libc.so.6
Backtrace stopped: previous frame identical to this frame (corrupt stack?)
(gdb) ore was generated by `/mnt/apps/bin/leos -s'.
(gdb) Program terminated with signal SIGBUS, Bus error.

最佳答案

sigbus是一个软件信号,由linux内核生成,因此您需要了解内核为什么要生成sigbus信号。这可能是硬件异常造成的,也可能不是。
确保数据的类型和使用方式正确对齐。SIGBUS的原因之一是无效对齐。尝试使用未优化的代码(例如,对于g cc或clang,不传递-O选项)复制错误。
如果您已验证对齐不是问题所在,请检查访问的范围。如果由于对设备总线的访问而获得sigbus,则需要了解如何将此内存映射到进程中,以及设备在该地址公开的内容。
检查内核日志。它们可能包含来自sigbus生成的调试信息。
如果该信号是由硬件故障引起的,则异常的原因确实在寄存器中传递,但只有内核才能读取该寄存器的值。对于失败的数据获取或存储,相关寄存器为DFSRDFAR,对于指令故障,相关寄存器为IFSRIFAR。但是,只有找到内核内部的情况,才能使用此信息。

关于linux - 访问外部设备时,ARM Cortex上的SIGBUS,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49521095/

10-11 05:18