尽管UPS都在尽职尽责地保护着IT设备的正常运行,但故障也是很难避免的。据统计,UPS本身的原因造成故障比例不足30%,自然因素和人为的因素造成故障的比例占全部故障数的60%~70%。故障或貌似故障的原因可归纳如下几种。这里吧引起人们恐慌和惊动厂家的一切机器现象统一成为“故障”。
一、怀疑“故障”
所谓怀疑故障,顾名思义,是指由于值机人员缺乏基本的分析能力和没有很好地阅读说明书导致的误会。有一些10kVA以下小容量的UPS,大都没有采用液晶显示,而是用4~5只发光二极管LED竖向排列成“棒”状指示灯,以形象地表示电池电压或负载的百分比,这种按百分比表示的方法,在装机时未经进一步校准一般是不太精确的。而大多数用户的注意力都集中在指示的精确度上,但也有的出现了大误会。例如,在一次重要的飞机校飞中,一测控站突然惊呼UPS带不上负载了!因为他发现负载指示灯都没有被点亮。这一非常时间惊动了上级领导和供应商,就在人们等待“维修”的时候,由该UPS供电的设备扔在正常工作。一场虚惊的原因是值班员发现负载指示灯不亮。随机说明书上清楚地写着,当负载在30%以上时,最下面的一个指示灯才被点亮。
又如,某UPS双机冗余并联系统正常运行时,值班员突然发现其中一台UPS的控制板上有两盏灯点亮,而另一台的控制板上则只有一盏登点亮,这二者的差异引起了恐慌,于是急招厂家修理。原来双机并联时,主机亮两盏灯而副机只亮一盏灯,在产品说明书上已有说明。
二、知识性“故障”
知识性故障主要是由于一些机器管理员自持经验丰富而实际是既缺乏基本理论只是又缺乏实践经验所致。例如,有一双30kVAUPS冗余并联系统,后面带一通信机。通信机电源刚一捷通就烧坏冒烟了,换了一台又烧毁了,又换了三台,这才工作正常。于是通信机厂家提出此故障是由于UPS三相输出电压的零点漂移而造成这一相电压过高所致,急招UPS厂家立即解决问题。经现场测量,UPS的三相电压都为220V,三项电流不足10%,又何谈零点漂移呢?实际查明是通信机厂家的电源有质量问题。
在早起的传统双变换UPS中,由于三相逆变采用了统一控制,因此在三相负载极端不平衡的情况下就会产生零点漂移,使三相相电压有很大差异。后来采用了对三相相电压分别控制与统一控制相结合的方法后,情况大有好转,可以使三相相电压的不平衡度小鱼2%。而近来的三相半桥逆变采用了分别控制,而且三相电压在统一相位的控制下各完全独立,及时在三相负载100%不平衡的条件下,也可以使三相相电压的不平衡度小于1%,这就为“非三进单出UPS不可”的用户提供了选择的空间。
三、操作故障
①为了使UPS安全可靠地开机运行,各种产品都有自己“特定”的一套操作程序。所谓“特定”,就是说各种品牌的UPS的设计思路不同,在操作上也各有各的考虑,并将其写进了随机的“操作手册”。按照“手册”程序操作,就可完全保证安全,否则就可能或必然出问题。然而,有的操作员以为电源很简单,不看说明书就按照自己的理解任意操作,结果造成了损失。
②无意识操作。例如,在维修期间,拆卸某一连接很牢靠的器件时,不小心碰坏了临近的脆弱器件而未被发现,修理完毕后加电时造成了二次故障。
③带电检查故障时,测了表笔探头误将电路或器件两点碰短路,形成重复故障。
④连接外部电池时,误将极性接错,烧毁了逆变器;有的电池链接末端被拧紧或节耗电池后忘记了闭合电池开关,在市电一场时,UPS因电池不能放电而停机。
⑤输入/输出线链接不牢,会造成交流电断电假象故障;供电局进行线路维修或该着时更改了原本的相序,因而导致UPS不能启动或切换;UPS加电后忘了启动逆变器,一直是旁路供电,市电出现故障时UPS也停止供电。
⑥值班人员在机房或机房附近的值班室乱放食物,找来老鼠啃咬电缆或钻入机器内部导致故障。
⑦不合理的布线。例如,将无屏蔽的远程信号线与交流功率线并行靠近走线。导致该部分控制信号紊乱,造成故障。
四、延误故障
①机器已经告警,由于值班员的疏忽而未及时发现与处理,由此而导致后来的故障。换而言之,如果及时发现时处理就可以避免后来的故障。例如,在飞机双机并联UPS系统中,负载被均分到两台机器上,有的UPS有时会由于某种条件的巧合而导致一台逆变器关机,系统就自动被地将故障UPS的负载转到另一台上,这是面板或监视器上会有显示告警。值班员及时或市电故障时间较长,另一台UPS就会转旁路或提前断电。
②电池在非理想的情况下运行时,尤其在长期没有充放电的情况下,更要加强监视,一经发现容量有明显降低,就立即更换。因为电池时效的速度有快有慢,有的是瞬间的,今天测量是好的,很可能明天就彻底坏了。
③车载或舰载UPS的保险丝和接插件在不停地震动中容易松动,从而造成故障。保险丝长期在通电的情况下运行,会发热软化过程的同时受震动弯曲下垂,如不及时更换,随时都可能断裂,造成故障。
五、维护不当或不及时导致的故障
①对UPS的定期维护是必要的,还应有一套严格的管理程序。不按规定要求进行定期或不定期保养是导致机器故障的重要原因。例如,UPS因长期不维护而导致机器工作不稳定、停机、不能启动和烧毁元器件等。代开机壳才发现,夹杂着导电离子的灰尘充满全机、覆盖了电路板、填满了绝缘的空气隙,混合着潮湿的空气破坏了电路的正常工作。用吹风机将这些异物清理掉就可一切归于正常。
②UPS维护完毕,工程师将市电输入开关闭合,而恰恰忘了启动逆变器,一旦市电停电,逆变器不工作而使电池无法放电,导致UPS的输出同时掉电。
③电池运行期限已到,一部分电池明显失败,按规定应全部更换,而用户为了节约,就将“将就能用”的电池保留,只更换那些再也无法继续使用的电池。新电池的作用不但得不到充分发挥,反而导致机器连续出故障。
六、经验故障
经验故障是不可缺少的,是不可多得的财富。但经验有其相对性,即在一种UPS上得到的经验不一定完全适合另一种,否则就会导致故障。
①以为具有单击操作经验的人员去启动一并联系统的UPS,按照他以往的经验启动逆变器后再去搬动输出开关,结果将逆变器烧毁。他不知道在这集中机器上并机时是先闭合输出开关而后再去启动逆变器。
②有的维修人员在维修一种UPS时,有几次输入保险丝断了,当场更换后就正常了。而恰恰在一次更换中引起了严重的连续故障。实际上导致保险丝熔断的原因很多,保险丝本身的质量不好会提前损坏,发热的保险丝在不停地震动中会断裂,输入整流器和滤波电容的穿通,逆变器一壁两个功率管的同时导通与几串等都会导致输入保险丝熔断。
③有的人对某品牌UPS特别熟悉,当改UPS不能启动时,就用改锥捅了一下直流继电器即可。而当另以品牌UPS上采用同样方法时,则烧毁了逆变器。
七、交接故障
交接故障主要是管理人员的前后配合不好造成的。
①实际管理机器而未被培训的人员和到厂家培训的人员不是同一批人。
②前面值机人员对机器进行的工作没有向后来者交代。例如,前面值机人员移动机器位置时而将UPS的外接电池组断开,时候又未向后来者交代,结果造成了市电和UPS同时停电的故障。
八、环境故障
环境故障是用户不重视机器的运行环境或没有能力优化环境造成的。
①有的用户将UPS放在了既无空调又无通风的环境中,夏季的室温高达40℃,又潮又湿,导致电池提前失效。
②有的地方供电条件很差,不但电压波动大而且还经常停电。工作在这种环境下的UPS电池经常放电,用户未向供货商提出快充电的要求,使电池长期处于亏点状态,也会导致电池早期失效。
③在雷电多发地或工业电干扰严重的地方,用户在输入配电盘内未配置一定级别的防雷器或浪涌控制器,致使UPS被损坏的现象时有发生。
九、选型故障
造型故障主要是用点者的一些糊涂概念造成的。例如,把UPS的效率当成了功率因数,把输入功率因数当成了负载功率因数和把视在功率当成了有功功率等;认为UPS负载功率因数越大越好,不懂得计算机之类的负载在目前不但需要有功功率更需要无功功率等。结果购回的UPS容量不是太大了就是太小了,选小了的UPS就会因频繁的过载而跳闸。
十、商务故障
商务故障主要是用户对供应商在价格和其他条件上的过分苛刻而造成的。
①UPS和其他机器一样,看起来有着同样的外壳、同样的内部电路环节等,但外壳的材料和元器件在质量上有着天壤之别,因此在造价上也相差很远。二者在一些功能和可靠性上不可同日而语。有些使用者不了解这些区别,而一味地要求不同档次的机器具有同等价格。供应商为了生意,不得不降低元器件的质量,结果使可靠性降低,故障率增加。甚至有的UPS压价太狠,容量合同签的是100kVA而拿到的确实60kVA的机器,原因是某厂家对二者采用的是同一机壳。
②有的使用者要求供货商对寿命为3~5年的抵挡电池做3年的免费担保,这本来是一个不太合适的要求,因从某种意义上讲,相当于在不清楚用户使用环境的情况下的终身免费担保。为了生意,供货商当然应允,日后也照样履行合同。但由于不断的故障、不断地更换电池,使UPS频频停机,给用户造成损失。