崇左供电局自动化系统“维稳”的那些事
中电新闻网讯 通讯员 成昌权 报道 年关将至,神州大地上又将迎来传统意义上新的一年。对于崇左供电局自动化班来说,意味着调度自动化系统又平稳运行了一年,这里面离不开自动化专业人员的精心“维稳”。
事故预想,防患未然
2015年12月中旬的一天,自动化班办公室突然传出一阵喧哗声,引得路人纷纷驻足,以为发生了什么事。
“我觉得可以先重启服务器,然后再重启故障服务器对应的前置服务模块。”一个声音说道。
“我认为除了重启服务器和相应模块,还应该尝试重启软总线。”另一个声音说道。
“嗯,有道理。要是还不行可以考虑换上新电源甚至备用的新服务器,然后跟厂家联系对新服务器进行配置。”又一个声音说道。
……
原来,这是自动化班正在进行每月一次的事故预想大讨论,探讨“当某一终端服务器发生故障,相应通道、业务无法切换到其他终端服务器上”这一假设的重大缺陷发生时的解决方案。对于抛出来的问题,各班员根据自己的工作经验以及所储备知识纷纷表达自己的见解,场面热烈。
为了进一步保证调度自动化系统的稳定运行,除了日常已出现缺陷的处理,自动化班还将系统软硬件中可能发生的重大问题引入到事故预想中作为议题进行讨论。通过事故预想的头脑风暴,班员们充分交流了自己的所知所会,增长了见识,同时也形成了一个个针对各个可能发生的重大缺陷的较为完善处理方案。一旦事故真正发生,也能有据可依,及时正确处理,将影响降至最低,不至于事到临头手忙脚乱或者不知所措,白白错过降低影响损失最佳时机。
日常消缺,系统维稳
“刚才接到监控班的电话说AVC客户端服务连接失败,检查发现昨天主站端的AVC模块异常退出了。”从自动化机房例行巡视回来的自动化值班员赵秋源向班长杨杰汇报说。
“怎么会呢?昨天我巡视置数的时候还能正常获取数据的呀,去机房,我们进入数据库查找看看还有其他症状没有……”。一群身影又走向自动化机房
“我认为AVC模块昨天确实已经退出,但可能因为程序的问题导致退出不完全,进入了一个‘假死’的状态,所以让人看起来它似乎还在正常工作,而到了今天完全退出了才被发现。”经过分析查找,班长杨杰为大家解惑道。
几经查找,最后,自动化决定将该模块加入系统的“看门狗”软件里面,下次它再退出就能自动启动,导致模块退出的具体程序问题则记录下来留待厂家来巡检时再解决。
以上场景仅是自动化班日常缺陷处理的缩影,在维护调度自动化系统的过程中,相似的情形并不少见。
对于调度自动化系统运行时出现的各种缺陷,自动化班秉持 “设备主人”的理念,充分发挥主观能动性,尽可能全面地考虑并实践解决方法,力争做到“表层缺陷彻底解决、程序缺陷影响最小”,确保各缺陷的发生对调度自动化系统正常运行及使用不产生持续性的影响。
场外支援,根除隐患
除了自身努力,自动化班还积极与系统、设备所属厂家联系,请求场外支援,通过远程指导以及定期到主站现场巡检的方式彻底解决日常维护中尚未根除的缺陷。
“徐工,前置监视器开启进入查看信号的时间比较长,每次工作时打开都要等很久,不利于我们工作效率的提升,你看看能不能优化一下?事项分发似乎存在问题,有时候实时界面收不到部分信号,你确认一下。还有AVC程序更换后不出策略,能不能协调你们公司负责这一模块的人员进行解决……”
“好的,那我们到机房去把缺陷具体梳理一遍,该更换的更换,该调整的调整。”
近日,恰逢调度自动化系统的开发厂家派人到我局进行本年度最后一次系统巡检,负责缺陷管理的自动化作业师黄农纯抓紧机会,拿出缺陷统计表与厂家所派人员进行沟通交流,争取在年前将与该系统相关的缺陷处理完毕,不留缺陷过年。
经过一周与厂家的配合,调度自动化系统缺陷统计表空了许多,能现场解决的各个缺陷都得到了处理,其余的也协商了相应的解决方案,系统的稳定性得到了更多的保障。
在未来的调度自动化系统维护工作中,自动化班将从根本上持续提升自身业务水平,提高消除缺陷能力,完善缺陷处理流程,坚持多层次、多方面联动消缺策略,确保新一年里调度自动化系统继续稳定、流畅运行。
周小博
相关新闻:
-
无相关信息
