0.环境:arm CPU 带有IIC控制器作为slave端,带有调试串口。
1.bug表现:IIC slave 在系统启动后概率挂死,导致master无法detect到slave。
猜测1:认为IIC device程序有问题
检查1:查看程序发现有可能溢出的部分,使用IIC 工具刷过量数据到slave,未出问题。
猜测2:认为IIC device寄存器进入异常状态未能恢复
检查2:检查正常IIC寄存器和异常状态IIC寄存器,未能发现问题。
猜测3:时钟分频问题
检查3:询问同事,答固定分频。
猜测4:看波形分析
检查4:波形未量到,测量波形导致通信异常,部分设备破坏,放弃该方法。
2.发现新情况:系统启动过程中如果调试串口有数据输入,问题会概率出现。如果串口没有输入则多次测试不会出现问题。
猜测1:串口中断导致IIC初始化时被打断产生问题。
检查1:删除调试串口设备树节点,发现IIC启动100%出现问题 T-T。
猜测2: 100%复现的问题和之前的概率出现的问题相同
检查2:检查寄存器,检查设备detect 表现,认为是相同问题。
3.删除调试串口,IIC受影响的原因?
删除串口设备树节点,IIC device 必出问题。
猜测1:怀疑调试串口外部硬件电平高低导致IIC外设受影响
检查1:检查原理图,未发现影响的可能性。
猜测2:怀疑串口初始化部分处理了部分IIC设备依赖的初始化(导致不初始化串口IIC不能正常工作)。
检查2:查看串口初始化代码未能发现有值得注意的初始化。
猜测3:怀疑串口初始化影响公共寄存器间接影响IIC。
检查3:发现公共寄存器IIC div分频部分和正常工作的分频不一样,改回后问题解决。
4.公共寄存器怎么被修改的?
删除串口设备后公共寄存器值不正常,串口收到数据后公共寄存器值不正常。
猜测1:调试串口或IIC代码异常导致寄存器值被修改。
检查1:增加打印,发现问题原因在于IIC初始化过程中分频寄存器设置失败。但是同样方法在IIC device端初始化时设置该寄存器是成功的。
5.公共寄存器为什么不能写入?
猜测1: 特定配置下IIC 分频寄存器为只读
检查1:芯片设计方核实不存在这样的设计。
检查1:在写入分频寄存器前增加打印,dump所有公共寄存器。和正常公共寄存器做比较,未发现问题。写入IIC分频器成功。
猜测2:增加打印信息后写入成功为必现,去掉打印会写入不成功。
检查2:证实猜测。
猜测3:写入成功和读取公共寄存器相关
检查3:减少dump范围,小范围dump写入失败,大范围dump写入成功。
猜测4:写入成功和写入时间相关
检查4:dump的寄存器次数不变dump相同寄存器。证实写入成功与写入时间相关。
6.为什么不能写入和时间相关?
思考:可能和时钟初始化相关,但是公共寄存器的时钟初始化状态dump是正常的。
猜测1:dump过程中时钟初始化完成(证据:增加dump后写入正常)。
检查1:减少dump范围,发现公共寄存器的mpll稳定寄存器未稳定。
猜测2:时钟相关初始化未完成导致写入失败。
检查2:根据时钟依赖,在写入前增加等待,同时去掉打印,写入成功。
去掉串口设备导致问题100%复现,原因是串口不用初始化导致IIC 时钟分频更早初始化,写入IIC分频寄存器失败。
总结:
1.解决问题过程中,曾经怀疑过时钟分频问题但是未检查寄存器,导致问题解决时间拉长。
2.最开始未能考虑问题和时间相关的情况,如果直接思考该可能性,预计提高解决问题速度。