公司有一台大型涂布机,主要硬件配置为几台1515-2PN、1217、若干HMI及若干ET200SP从站。1515PLC下面控制大约30个力士乐伺服驱动器,使用PROFINET通讯协议。PN网络所使用的网线及接头均为西门子原装。交换机为第三方品牌。
故障发生大约在去年中旬,当时设备已安装调试完成运行大概1年左右,期间并没有出现大的设备问题。设备正常生产过程中,突然报警停机,HMI报警显示为伺服驱动故障。于是赶到现场查看驱动故障代码,驱动器面板显示F4009,查看力士乐伺服故障报警手册。
故障原因:
F4009 :总线失败
现场总线的通讯失败。在现场总线初始化并投入运行后,看门狗被激活,也就是说报表在监控的时间P-0-4075,总线:看门狗内没有被收到。
初步判断是通信失败,数据在看门狗时间内数据丢失导致的。刚开始以为只是偶然发生的一次异常,复位后通知产线继续生产。但是一个多小时以后生产通知该产线又有伺服驱动故障,并且报警的不是同一个伺服。由于是产线任务比较紧张,通讯问题也不是一时半会就能根治,只能告知生产继续,带产线停机后排查故障原因。
在接下来的几天内又陆陆续续出现了多次伺服故障报警,报警伺服也增加到5-6台。并且在设备不运行时也会不定时出现伺服故障报警。最终只能通知设备厂家过来一起商量对策。解决措施主要是重新整理网线,重新紧固网线接头并检查屏蔽层,修改部分伺服通讯看门狗时间,检查交换机地线连接。
重新更新的网络拓扑:
看门狗时间:

待产线停机后立刻安排电工一起按照之前商定的解决措施开始排查。首先就是重新按照设计的网络拓扑图进行网线的连接,同时全面检查网线接头是否紧固,网线屏蔽层连接是否正确。同时修改组态中的看门狗时间之前为24ms,修改为128ms。经过两天的整改,网线及接头基本整理完成。为了减少生产损失,并没有马上交付生产使用,我们观察确认了两天设备状态,并没有再次出现伺服故障,确定故障应该已经排除。