排除一起840D sl系统盘根错节的故障经历
昨天,正在工厂处理一起其它设备异状故障,工厂领班电话打给我说,现场一台设备有异状,说一台西门子840D sl系统设备的尾座(双主轴设备的上主轴)只能下,而无法向上的问题,且操作尾座上升的时候,伴有报警信息被触发,图示1:

到现场,从“诊断”下的“报警清单”中,可以看到设备在JOG状态启动运行时,就触发了1个“报警清单”信息。700337#,通过报警文本的简单说明,也能够看到大致的问题所在,系安全检测被触发了的信息。
查找700337#故障报警程序很容易,交叉引用通过报警号700337#很快找到报警关联的程序段,图示2:

700337#相关的报警程序段。
触发报警的根本原因是M68.0这个线圈变量没有在此时被使能,那M68.0是如何编写报警程序的,图示3:

经查,触发M68.0线圈未使能可能是安全信号DB18.DBX39.1或者是DB18.DBX38.1和DB18.DBX39.2或者是DB18.DBX39.4这些安全位置检测信号没有到位。于是,在JOG状态下,将这些安全门关联的信号,手动操作下降到位后,安全信号能够被正常使能,M68.1 = 1。报警信息提示说明此时设备只是处在安全门被打开的不安全因素中,并不是造成设备的尾座不能够上升的要因。当我将这3扇安全门全部关闭后,M68.0 = 1,700337#报警消除,再次操作尾座上升,此时报警信息转变为,图示4:

从信息描述为700137#上分析,此时尾座已经在升了。但是实际尾座且是纹丝不动,也没有到达上极限位置,监控尾座位置数据也是没有发生变动。继续监控相关报警程序,图示5:

触发700137#报警的要因,此时是M103.5 = 1,继续查找M103.5这个线圈的条件,图示6:

造成M103.5 = 1的根本原因是位置升起的变量小于了位置的实际位置数据,即变量#Aux1 < #PosTS,而#Aux1是由位置升起变量DB122.DBD20折算过来的,查看位置参数,图示7:

原来操作员无意将这个参数设置为0了,重新将尾座升起的参数修改为1400.0mm,再点动尾座升按钮,此时,尾座能够正常升起,操作员描述所谓的故障原来是一个不经意中产生的错误设置,或者没有设置该参数。
排障小结:
如果设备的报警信息做的比较完善了,那运维人员可以根据设备操作时的“报警清单”和“信息”提示的内容排障,此类排障工作相对算是比较轻松的,属于“顺藤摸瓜”方式,根据报警信息,去排查被触发的报警,从而来排查设备报警,排障思路是根据报警信息而来。前提是设备制造商在调试设备或者该设备已经有大量的用户应用,且比较成熟的设备,已经编写出非常详细的报警逻辑程序,可以按此方法排障。
但是。下面这个报警就是自己给自己挖坑,然后再自己根据具体的维修经历排障的。
之前,因为该设备的A门位置检测pilz安全位置检测开关,PSEN cs3.1n器件故障后,采购备件又一时未到。我评估了A门可能会造成的安全隐患后,临时用红色导线短接了西门子安全模块的输入信号,模拟方式屏蔽了A门的安全检测信号,虽然这个有违背设备安全特性,但是,根据实际情况的安全评估和备件缺少的实际情况,该门除了换模具时会打开外,平时正常工作是不需要打开的,且临时屏蔽也未能够给设备的正常运行造成不了多少隐患和危害,所以,我就这样临时处理了。
今天趁着排障本起故障的机会,考虑到安全问题,我将短导线拆除,因为,pilz安全位置检测开关早就采购回来并更换好了一段时间,因为,设备一直在运行也没有及时恢复到外部pilz是安全位置检测信号,今天刚好是机会,拆除短接的红色导线恢复原状。拆除后,设备也一直在正常运行。等我第2天早上过去查看该设备的运行情况时,晚上的设备操作员和我反映,昨天晚上“稀奇古怪”的报警出现过无数次,很难理解,有时候设备没有报警的状态下,NCK的程序会自动停机,也有时候在运行过程中会停机,最诡异的是居然报警这个信息8:

报警信息提示是系统性的报警27022#、27011#,上、下2个主轴都会有,也可能只是一个主轴的报警。我让操作员将加工余量减小,且将进给率降低试试,目的是减少主轴的负载率。几次试运行下来再次报警,而这次报警居然是3个滚轮尚没有接触到工件时触发的报警,工件没有接触到主轴,而触发这个报警,莫非是2个主轴的轴承问题?同步带问题?还是其它的什么问题?
一连串的排障过程后,我将问题锁定在昨天对A门安全位置检测开关的稳定性上,图示9:

该门的pilz安全位置检测开关由于A门的钣金变形,pilz的位置检测开关与感应块的距离较远且由于钣金变形下沉后,感应块检测距离变大,可能会造成信号不稳定的抖动。将设备切换到JOG状态后,我重新恢复将昨天拆除的红色临时线再恢复连接到西门子的安全模块的输入端子中,再次运行自动,待一个下午运行下来再也没有出现报警。在暗自庆幸找到问题的同时,我在想,如果我没有这样的经历(拆临时屏蔽的短导线),而是让设备钣金慢慢变形的情况下,我需要花多大的精力才可以查找到这个故障点引起的原因,庆幸的是我刚刚昨天处理过的故障再结合昨天晚上的报警现象,才会联想到可能有的这个情况。问题已经找到,已经告诉同事了,等设备停下来,把钣金加强处理一下,这起故障应该算盘根错节的吧,通过这2起排障过程,给需要参考的同行一个参考排障的过程,设备出现报警并不可怕,只要仔细分析,排除潜在的、可能的问题点,将问题逐步锁定在一个比较小的范围,利用经验或者替换方式,逐步排查,直致找到真正的故障原因。