杨 志
电力行业运维现状
随着信息技术在电力行业经营管理中的广泛应用,信息安全问题越来越显得重要。电力系统信息安全问题威胁到电力系统的安全、稳定、经济、优质的运行,影响着数字电力系统信息化的实现进程。
经过近几年的信息化安全建设,相关电力部门都已经建设了完备的基础网络,同时实施了一些防御安全系统(防火墙,网络版防毒系统),为电力部门的信息安全保证起了很大的作用。但是随着电力部门对信息化的依赖程度不断提高,光凭借单纯的防御安全系统,并不足以保证企业的各个系统正常运行,例如,各种平台如操作系统和数据库的运行,直接影响到业务系统的正常运作,很多业务系统出现的各类故障都是因为基础信息平台引起的。这些系统的运行参数需要被统一监控管理,一旦出现异常情况,需要第一时间通知系统管理人员,把故障隐患及时排除,使企业的损失降到最低。
另一方面,随着桌面机的大量部署,桌面设备带来很大的安全隐患,一方面一些安全设置不高的机器一旦感染病毒木马,会严重影响整个企业的网络安全,另一方面,桌面机的用户又缺乏计算机的安全防范技术,需要系统管理员提供更好的技术支持。
另外,电力部门大多拥有数量众多且分散的PC机,在实际工作中,维护和管理起来非常困难,特别是没有任何技术手段支持,仅靠现有有限人员进行人工的管理和维护,想要把这项工作做好,几乎是不可能的事 情,所以工作往往停留在对问题的紧急响应方面,显得极为被动
基于以上的现状分析,有必要建立一套完善的IT运维管理系统,使得信息管理部门能随时掌握了解企业信息平台发生的各种情况,在第一时间感知系统出现的故障和问题,同时应建立响应的快速反应计划,在出现故障的时候迅速采取措施,恢复网络或系统的正常运行。
电力行业IT运维管理解决方案
根据电力部门的实际网络监控需要,广通推出了Broadview IT运维管理平台,以管理电力部门的网络环境,保障其正常运转;同时桌面管理兼顾了电力部门内网的PC机监控,有效规范了上网行为,从终端设备做好安全防范,确保网络系统安全无忧。
一.网络管理确保电力网络不断
1 、基础网络监控系统
信息传输网络如同高速公路一样重要,各种资源通过网络进行输送信息和数据,网络出现故障,尤其是中心交换设备出现故障时,企业信息处理将处于瘫痪的境地,这也是使用IT运维管理系统的原因。针对防火墙安全防御层的软件硬件的监控,将其纳入IT运维管理系统中,其实现方式是,对于支持SNMP的设备,通过SNMP获取其运行的状态和性能信息,另外,各个系统配置各自的报警,将其转发到 信息资产综合管理系统中,这样可以实现对网络层从普通交换机路由器到安全防御设备的全面监控。
2、主机操作系统监控系统
包括主机硬件部分及其操作系统,如磁盘阵列和WINDOWS 2003 SERVER等,这类信息资源与网络同样重要,只不过他的影响有时候是局部的,一台财务服务器的瘫痪不会影响到OA系统的运行,但是对于财务部门将是灾难性的,所以对于服务器的操作系统,IT运维管理系统都做到了全面监控。
IT运维管理系统主要管理Windows的可用性和性能:监控性能统计数据,如CPU利用率、内存利用率、磁盘利用率和应答时间。监控Windows系统中运行的进程:如果Windows系统或该系统中任何指定的属性出现问题,将基于所配置的阈值生成通知和告警;基于配置自动执行操作;即刻呈现性能图表和报表;基于可用性、健康状况和连接时间分组和显示报表;提供历史的和当前的Windows性能指标,以便了解特定时间段内的性能状态;监控整体的CPU利用情况,并显示哪些进程正在消耗多少CPU资源;监控内存使用情况并检测内存消耗大户。
3、数据库监控系统
电力部门目前绝大部分的应用系统都依赖数据库系统,从OA到辅助设计,核心的业务系统更是如此。数据库里保存着信息系统最核心的资源:企业的数据,所以一个正常运行的数据库尤为重要。
电力部门信息系统的运行依赖多种执行关键业务的服务器来保障业务的顺畅运行,但通常情况下会出现故障时间或应答时间延长,这都将影响到最终用户以及自身的业务进展。电力部门所需要的就是一个能够监控其网络中所有应用和服务的监控软件。
IT运维管理系统的数据库管理功能有助于在关键数据库出现的性能问题影响到最终用户之前快速检测、诊断和解决这些问题。同时能在影响到业务可用性之前将问题通知数据库管理人员和使用人员。
4、综合监控告警平台
以上所述是各个子系统的功能。这些子系统监视各自领域的参数,根据事先配置的频率将各项参数值提交到综合监控告警平台。IT运维管理系统负责接受各个系统(包括各类监控系统和各类成熟的网管系统)的告警信息,根据配置数据库,将告警路由到相关的告警方式上(如短信,邮件,传真,执行外部程序或者声光电告警)同时根据事先配置的关联策略,将某种故障可能引发的其他的故障实现报告给相关管理员。
各种丰富多样,高效的告警方式,包括:短消息方式,通过省局网络通道将故障信息发送到相关管理员的手机上;本地声音告警,本地播放告警信息,如警报声或者事先录制好的语音告警;警灯告警,可以接到值班室或者其他地方,将一些重大事故,如火警等通知值班人员。
二.桌面管理确保数据不丢、系统不瘫
IT运维管理系统在主要从资产管理、桌面管理、补正管理等方面管理电力部门的设备,通过以上功能实现资产明确,轻松管控内网安全,实现高效、批量安装软件、补丁等。
1、 资产管理
资产管理包括所有IT相关的硬件软件的资产清单,汇总,报表及异常情况报告等管理。资产管理作为桌面管理的一个部分,但是又不仅包括PC机的管理。资产管理功能从以下两个方面予以实现:
一是管理的资产类别,包括PC机、交换机、服务器等硬件和操作系统、应用软件等软件这两个方面。资产管理不仅可以实时监视资产的当前运行状况,资产变动,而且对于一些非IT的设备,或者一些无法直接获取数据的设备也应纳入管理范围,允许用户手工增加编辑这些设备。对于资产的类别,IT运维管理系统也应允许用户自由添加,编辑和删除类别信息,如可以允许用户增加一个“存储阵列柜”的资产类别,用户可以自己编辑相关的属性。这样可以实现一个完整的资产管理。
二是基于生命周期的资产管理,资产的生命周期,主要是指资产的采购,入库,领用,正常使用,维修,库存,报废等一系列资产的生命状态。资产是个动态的概念,我们要随时掌握当前有哪些设备是正常运行的,哪些处于维修或者库存状态。基于生命周期的管理可以全面的考查资产的全面信息。
2、桌面安全管理
桌面的安全包括如下方面内容:
桌面的补丁管理:桌面系统大多为WINDOWS平台,因为操作系统本身的原因,系统需不断的更新补丁和服务包才能处于一个相对安全的状态,桌面的补丁管理包括补丁的检测,补丁内容的查询,补丁安装情况的检测,补丁的自动分发安装等。
桌面的漏洞管理:桌面系统会因为一些用户配置的原因,造成为现的漏洞,如管理员的口令设置的过与简单甚至为空,不必要的共享,系统的注册表出现一些危险的起动项信息。
桌面运行状态:桌面系统在运行的时候,也许会突然出现流量增大的现象,大多是中了木马病毒,这样对整个系统是严重的危险,需要及时发现处理。
IT运维管理系统能够快速定位全网范围内,使用网络流量最多或者突然增长的设备,随时可以监视网络资源的使用,确保不被乱用滥用。系统应展现一段时间,使用网络带宽最高的多0台设备清单,应该可以分析占用带宽的协议类型。
3、软件分发
软件分发是桌面管理模块的一个重要功能,实施以后,电力部门的批量软件安装工作可以大为节省。对于软件分发,应该通过软件仓库将常用的软件和定制的软件上传到里面。软件分发应支持标准的微软安装包的格式(MSI)。软件分发应记录分发的结果,可以查询哪些设备成功的安装,哪些出现故障。
由上可看出,电力行业需要集网络管理与桌面管理于一体的IT运维平台管理工具,Broadview IT运维平台完全满足了管理需要,为电力行业提供了优质、全面的IT运维解决方案。