论中大型设备对系统等电位、接地的重要性
一台西门子840D sl系统的设备,cpu接口下挂profinet I/O站及profibus DP站点若干,系统配置,图示1:

所谓中大型设备,泛指一台设备当中,有主体结构、独立的液压站、润滑站、风机冷却系统等组成,各设备组件之间是互相独立,分离式结构,该设备已经使用3年余。
前几天,该设备突然出现重复的系统频繁性停机报警故障,诊断界面也没有直观性信息,故障报警的出现也无规律可循,一次难啃的“骨头”就此又拉开序幕,诊断界面,图示2: 
报警触发原因分析,主要报警原因为800014#,该类型报警信息泛指相对报警范围及信息都比较多的,一下子无法通过一段文字能够描述清楚的报警信息。因为类似的故障,之前有过一次,最后是一个易福门LT3023温度、液位传感器出现可能的内部通讯间隙性硬件故障,当时,同事是通过排除、替换方式,将问题锁定在这个传感器上的。
经过现场检查及OP屏诊断界面观看诊断信息后,没有找到明显的有价值的报警信息,我如法炮制找来一根备件传感器,设置检测介质和上、下限等参数,将传感器插入润滑站,断电重启设备后正常,一直在设备边等待了近一个小时,相安无事后,判断为易福门的温度液位传感器硬件故障原因引起的,报警没有再次触发就回办公室写总结去了。直到晚上12点多,该设备操作员反馈说设备出现了一次停机。操作员知道前一次的排障过程,于是,把传感器根据我之前的说明,将传感器拿到一个提前准备好的水桶中,用于排除可能的液位扰动引起的传感器错误报警,一个晚上,据操作员说同样类似的停机达10多次。
第二天,一上班,先紧急联系供应商,让他顺丰快递赶紧再发一根传感器过来,进行替换确认。然后,直接到故障设备现场,查看传感器HO.T和LO.T的参数,该参数是易福门记录传感器的液位高、低信号的数据,进入后查看也没有异状数据出现。液位没有异状只能在外部是否受到干扰入手排查,对传感器外壳接地,防传感器震动的硬件方面入手,探寻可能的原因,这样来来回回的停机查找,始终没有找到有价值的原因,晚上又是10多次的无症状停机,搞的操作员抱怨连天,哎,我们运维有时候也很无助的,但是,在没有真正找到问题原因前,始终有工作压力需要承担的。
晚上,我看***上,还是实时在反馈无辜停机的次数。白天,能够想到的措施都先先后后的查找、确认过了的,莫不是我设备安装之前的等电位,系统接地的那些螺栓出现了松动?在这样的苦思冥想中,早上,起床的手机铃声在催我起床了。
上班,处理好每天的基本工作,还是赶到设备现场,以求能够在设备现场找到蛛丝马迹,但是一次次的尝试,都将以一次次的失败而告终。供应商很给力,仓库电话告知传感器到了。拿来传感器一通应用参数设置后,拿到现场,再次将新的传感器更换上,可是,没有5分钟停机故障还是无情的出现,此说明不是这个传感器引起的故障,此时,心里感觉快要到无计可施的绝镜了?如果,此时放弃,让设备厂家来现场服务,那难得的查找过程将会被失去,几天的辛苦和心血可能会白流了。
重新整理心情,对诊断缓冲区的信息,一条一条的进行了梳理,从历次的报警信息中,找到22条信息,这条信息是系统检测到某一个时段的起始报警的,这样的辨识报警信息是非常重要的,图示3:我有将报警信息另存的习惯。

从报警信息的地址中,看到是多次触发的报警,时间戳不同,说明报警的触发事件是分别的多次,2025年下午14点25分一次,2025年下午14点49分另一次的触发报警,且这次报警是有易福门的AL1102的3#站点开始的,报警含义是模块被拆除/无法寻址。重新对该接口模块的以太网插头、24V电源插头及电压进行测试,结果没有发现明显的异状。返回硬件组态在线看各从站,此时并没有再出现报警,说明这个丢站的瞬间触发的。此时,我想到了是否是电磁干扰原因,该设备使用3年,那些等电位、接地系统是否还可靠?在3#站点检查,确实因为靠近主体设备较近,等电位、接地螺栓有松动和被水基石墨腐蚀的迹象,拧下螺栓,重新对95平方的铜接头进行打磨处理后,回装、紧固。
当检查到液压站设备外壳做的等电位连接时,“意外”出现了,在紧固螺栓时,M12的等电位接地螺栓居然被拧了下来,图示4:

原因应该是当初焊接的质量问题,打电话叫来同事焊接后,上电,半个小时过去了,因需要参加一个设备会议正暂时离开,等会议结束,再次到设备现场咨询说没有再次停机了,难道是有心插花,花不开“无心”插柳,柳成荫了?希望是吧。这个只能等待进一步的使用效果了,几天过去后,报警企盼的报警始终没有再次出现,说明根本问题就是这颗不起眼的等电位、系统接地螺栓了。
小结:
该液压站配置45KW电机2台,作为液压伺服主动力,液压的辅助系统配置22KW的电机及4.0KW的循环冷却系统,主轴电机冷却系统组成,而这些电机22KW以上是星-三角启动,其它电机为直接启动方式。这些电机及阀组的控制电缆均在这个桥架中通过,图示5:

显然当整个液压站系统等电位、接地系统断开后,原来的抗电磁干扰能力,大幅降低,出现强电干扰在所难免,而易福门的3# profinet I/O从站设置在液压站的上方这个位置,图示6:

AL1102易福门接口模块,以太网连接打开、电源接口检查、确认中。
在本次检查中又发现设备安装时,设备制造商没有按要求将以太网电缆的金属屏蔽层,按要求连接到金属屏蔽层上,使电磁干扰更容易被侵入。一颗并不起眼的等电位、接地连接螺栓的松动,掉落,造成我对本次排障时间整整化了3天,无数次的丢站,无数次的排查、替换,最后结果居然是一颗接地螺栓引起的。本例比较典型的系统排查案例,有一定的参考价值,特整理后,发到论坛上供大家参考。