产品是做工控的,MCU采用的STM32F407,双MCU用SPI通讯,1块做通讯,一块做控制。产品具有单机独立工作和主备从并联工作两种方式,并联时采用的CAN总线通讯,控制采用modbus TCP通讯到控制室。目前遇到问题,当产品单机独立运行时没有问题,采用主备从并联方式运行时,主机、备机、从机之间采用CAN总线交互数据,主机运行时,备机处于待机状态,从机运行状态跟随主机,主机在运行半个月后,通讯芯片出现死机,通讯中断,状态指示灯闪烁停止,控制芯片正常运行,控制停止输出,工作自动切换到备机运行,备机由待机状态切换为运行,从机正常工作。主机断电恢复后,启动到待机模式,又工作半个月后,备机通讯芯片死机,控制芯片正常运行,由于通讯芯片死机,中断输出。工作自动切换到主机运行,从机正常工作。各位大神帮忙分析一下,这种现象问题会不会出现在CAN通讯部分?还是其他问题啊?会不会是系统预分配的堆栈空间不够,溢出引起的? |
盘古UE-STM32F407工控板原理图
STM32F407 定时器触发DMA 求助大神
【MCU实战经验】基于STM32F407的音频播放器设计
【STM32F429心得\疑问】+STM32F4之FSMC和FMC
STM32F429读取IO口传输的数据速率
STM32F407ZGT6 手摸芯片背部重启
STM32F4 SPI 动作时,软件片选信号被拉高,IO口程序逻辑失控
STM32F401RE NUCLEO求助,串口一直不能进中断
读取STM32F407内部温度传感器值错误
STM32F429多路内部ADC独立采集的办法
1.可能堆栈异常,例如某个子程序,开的一个变量缓冲不够,一开始也没问题,等频繁调用时,慢慢造成你的PC指针或者溢出。
2. 还有一种就是can使用中断方式,是否使用了过多的操作,因为断开没问题,只有联网通讯才出现。
3.可以只保留CAN通讯功能,把其应用的先删除,再试试,会不会出现,这个可以区分是底层的硬件方面的,还是应用层出的问题,缩小范围吧。 建议多搭几套测试环境,看看是那种环境出来的
以上仅供lz参考, 开发最大的工作就是找思路的DEBUG
评分
查看全部评分
1.硬件问题
被静电打死的情况比较多,你试试花两块钱买个打火机,把里面那个啥拿出来(会放电的那个),在产品外壳上作死的打
PCB布局不合理,电源不稳定等,这个拿示波器慢慢测吧
2.软件问题
比较艹蛋,如果是发生比较多,可以用仿真器连着,然后看芯片的情况
如果是偶然性的,那就尝试做个串口或者其他的能显示出来的方式,把一些怀疑的地方打印出来
没什么好的帮助,祝楼主好运
评分
查看全部评分
我把通讯的相关参数全部通过modbusTCP送到上位机了,出现问题后modbusTCP停止,停止前的参数都是正常的,通过仿真器,一般仿真器连续仿真几天就不错了,但是我们设备一般出问题至少都超过半个月,也没办法仿真,现在我只能扩大堆栈空间,已经开始做老化测试了,希望有用吧
评分
查看全部评分
没有,这个看过,而且重启后马上就正常了。
评分
查看全部评分
我遇到过多次爆掉的情况 请问您重启之后就正常收发了 还是说用示波器卡过波形
因为是工业设备,一年365天都在运行,没有空闲时间,因为从机的工作状态是从主机来,如果从机和备机检查5个工作周期没有接受到主机信息,则备机会替换掉主机工作。
重启后就正常收发了,而且用示波器测试波形也是正常的数据帧
评分
查看全部评分
评分
查看全部评分
程序运行后开始工作就没有初始化代码了,也无硬件发热情况,而且从机是一样的装置,并没有出现死机现象。单机也不出现死机
硬件经过静电测试的,也通过EMC测试,没有问题;
软件出问题至少都是工作半个月,仿真器仿真不到这么久,而且一死机连modbusTCP都停止工作了,显示系统状态的指示灯也不闪烁了,但是晶振肯定是有波形的,示波器测试得到。
是不是某个变量溢出了判断失败,比如一个毫秒计数器a,然后判断条件if((a>(b+500))b=a,dosomething;如果a计数到最大后再计数就变成0,然后判断一直就不成立了
评分
查看全部评分
评分
查看全部评分