控制系统硬件及软件构成:
(1) 操作监视站(HIS)两台,操作系统为Windows 2000,配以701网卡,以接入实时控制网(V net),实现实时监视、操作和组态等功能。
(2) 控制站(FCS) 1台,用于过程I/O信号输入、输出及处理,完成模拟量调节、顺序控制及实时运算等实时控制功能。
1、故障经过
2005年6月5日15:36:35,珠海盈德气体有限公司16300m3/h空分设备中控室DCS系统操作监视站突然发出异常的“嘟嘟”声,紧接着除循环水系统大水泵外(因其没有与DCS系统联锁),所有的机器瞬间全部停车,空分设备被迫停车。
DCS系统历史信息记录如下:
15:36:35 FCSO101 Too Heavy Load(控制站0101负荷过重,这是第一个故障信息);
15:36:40 FCSO10l IOM Fail F101 NODE 01 SLOT04;
15:36:44 FCSO 101 IOM Fail F101 NODE 01 SLOT 01。
所有NODE (控制分站)的IOM (控制处理模块)全部发生故障,所有位号都出现输入回路断路(IOP)、输出回路开路(OOP)报警。
15:37:11 IOM模块IOP、OOP报警均恢复正常。
故障发生后,仪表工程师立即与DCS系统供货方技术人员联系,在其指导下,做了以下工作:
(1) 控制站(即FCSO101)断电,CPU后备电池同时失电,内存的项目软件程序丢失。
(2) 过5min后,重新启动控制站,然后仪表工程师站重新把项目软件下载至控制站,并重新启动工程师站和操作站。在重启完毕后又出现了FCS0101 Too Heavy Load的系统报警,但其它数据显示均恢复正常。
(3) 为尽快恢复生产,19:33:55启动空压机,逐步恢复整个工艺过程。但在氧压机启动后,部分数据趋势图断线现象重新出现,其它方面情况正常。
2、故障原因及处理措施
在2005年4月空分设备调试过程中,仪表工程师针对其工艺流程完成了整个项目软件程序组态,并通过了测试。但当空分设备整个系统开启并正常运行后,DCS系统的趋势数据记录图出现了断线现象,并且越来越严重。当时并没有引起足够的重视,其实此时DCS系统已经出现了负荷过重的情况,只不过还没有达到严重的程度。
在此次停车故障中,DCS系统出现“控制站系统负荷过重” 报警。经检查,控制站FCS0101的“CPU IDLE TIME (系统空闲时间)” 为0,表示系统在规定的扫描周期内没有足够的时间处理所有事件。
CPU IDLE TIME越长,系统的负荷越小。
CENTUM CS3000 R3.03.00版本软件相关资料上介绍,CPU IDLE TIME的时长是“with a little time”,意思就是有点时间就可以了。但在实际应用中,厂家推荐CPU IDLE TIME大于9s,也就是说系统负荷在85% 以下;最低安全值是5s,对应系统负荷91.7%。
发现问题所在后,仪表工程师立即对项目软件进行优化控制,将其中一些没必要用“高速扫描”的功能块改为“中速扫描” 或“基本扫描”。6月6日11:57,修改完毕,CPU IDLE TIME从0提高为6s。继续观察,DCS趋势图断线现象没有出现。也没有其它异常。再进一步优化系统资源,CPUIDLE TIME提高为10s。故障得到了根本解决。
DCS系统供货方发来的项目软件分析报告,也证实了故障的实质原因在于DCS系统负荷过大,导致系统在瞬间无法完成运算处理及控制功能。
在采取了前述措施处理后,为了进一步优化控制,对Pc机本身自带的Windows 2000操作系统的系统内存值也进行了修改,最小值从384Mb提高到768Mb,同时指定了严格的巡检制度,由专人每天检查HIS和FCS的运转情况,检查内容包括CPUIDLE TIME等。
3、结束语
故障发生后,及时联系盈德气体总公司其他气体公司的仪表工程师,检查各自的DCS系统(都为同一型号的DCS系统)运行情况,其他气体公司的CPU IDLE TIME分别为34s、5s、10s,都在安全范围内,但是还需要对系统资源进一步优化控制。根据各自工厂的具体情况,在确保设备安全的前提下,整理项目软件,优化系统资源,保证空分设备的正常运行。