最新消息指出,2003年8月14日发生的美国及加拿大部分地区史上最大停电事故是由软件错误所导致。 著名安全机构SecurityFocus的数据表明,位于美国俄亥俄州的第一能源(FirstEnergy)公司下属的电力监测与控制管理系统“XA/21”出现软件错误,是北美大停电的罪魁祸首。专家对这套广泛分布的系统的进行了持续数周的极为细致的代码检查,以便找出导致错误的程序所在。根据第一能源公司发言人提供的数据,由于系统中重要的预警部分出现严重故障,负责预警服务的主服务器与备份服务器接连失控,使得错误没有得到及时通报和处理,最终多个重要设备出现故障导致大规模停电。
预警系统崩溃后没有接收到更多的警报更没法向外传播,操作员并不知道预警系统已经失效,他们发现了部分异常情况,但因为没有看到预警系统的警报,而不知道情况有多么严重,以致一个小时后才得到控制站的指示。但此时没完没了的故障干扰已经让操作员反应不过来,无法控制整个局面。正常情况下,出现错误的网络会立即与其他网络分隔开来,这样一来错误就会被固定在一个地方,但是同样由于预警系统失灵,操作员没有做出应有的反应,最终使得错误蔓延,一发而不可收拾。
第一能源公司目前打算将采取竞标的方式来更换系统。未避免事故重现,NERC(North American Electric Reliability Council,北美电力可靠性委员会)提出了指导意见,责令第一能源公司在升级系统前为XA/21系统安装所有补丁程序。