安徽省电话交换技术支援中心 张昱 刘伟 郑连城
摘 要 给出了一种适应市县一体化改革的电信动力及环境集中监控系统——TELPOW的解决方案。重点介绍TELPOW系统的系统结构、组网方案、功能设置以及关键部分的设计思想。该系统可与电信本地网网管系统有机地融合,在综合电信网管的实施上进行了初步探索。
关键词 集中监控 维护体制 采集设备 设备类 信号类
1 引言
——为了提高全省电信系统各通信局(站)的通信机房动力及环境集中监控的水平,保证动力设备的正常运转,确保通信畅通和电信生产安全,安徽省邮电管理局(以下简称省管局)和科大恒星公司合作开发了电信动力及环境集中监控系统,并在芜湖市本地网试点,系统于1999年8月通过验收,现正向其他地市推广。
2 TELPOW系统的系统结构
——电源监控系统是对电源系统和空调系统的各个设备进行遥测、遥信和遥控,达到实时监视系统和设备的运行状态,记录和处理相关数据,及时发现故障并发出告警,对智能设备能通过本系统进行远程控制,从而实现通信局(站)的少人或无人值守,提高供电系统的可靠性和通信设备的安全性。由于该系统是对本地网网管和集中监控系统功能扩展和完善,因此应尽量利用已有的网络平台和硬件资源。使其能和 TEDCOM系统(安徽省本地电话网网管和集中监控系统)统一维护和管理,从而能投资省、见效快地在全省各个本地网中推广使用。
2.1 TELCOM系统结构简介
——已有的TELCOM系统为两级三层客户机/服务器(Client/Server)体系结构,“两级”表示省、地市两级网管系统,“三层”是将应用功能分为表示层、功能层和数据层3部分。
——地市级网管系统的组织模式为“操作终端—服务器—接口机—交换机”。其中接口机负责实现对交换机的数据采集和人机命令的发送及命令结果的回收;同时还肩负报告分析及向服务器发送关键数据。一台接口机可以连接若干台交换机。在一个本地网内,接口机有多台,一般分布在交换机机房近端。接口机与服务器以及操作终端与服务器之间的通信方式为符合TCP/IP标准的自定义数据包。
2.2 TELPOW系统结构设计
——为利用已有的网络平台和硬件资源,同时满足技术规范中SC、SS、SU和SM的分级结构,我们将TELPOW系统(电信动力及环境集中监控系统)的结构设计如下:
——1)系统仍为两级三层客户机/服务器体系,与TELCOM系统共用网络平台和服务器。服务器为双机热备,平时TELECOM 和TELPOW分别独自运行在两个不同的机器上;当其中一个机器出现故障时,其所运行的系统自动切换到另一机器上,形成两个机器互为主备份的格局。
——2)对于技术规范中 SC、SS、SU和SM的分级结构,本系统不是从物理结构上划分,而是在统一的本地网“操作终端— 服务器—接口机”的模式下进行逻辑上的划分,即由软件处理这种分级的不同功能需求。
——3)利用TELCOM系统的接口机实现对监控项目的数据采集与控制。由于目前TELCOM系统的接口机基本分布在交换机机房近端,而监控设备与交换机房基本上是在一个地理位置的,因此利用TELECOM系统的接口机可以节省硬件的投资,更好地发挥它的作用。当然,对于没有TELCOM系统接口机的通信局站还是需要额外购买相关的硬件设备。
——4)接口机对监控信号的采集与控制是通过其他厂家的采集设备间接实现的。这样做的原因主要有以下考虑。
——·目前市面上的采集设备产品比较成熟可靠,而开发研制采集设备的周期比较长,引入其他厂家的采集设备可以在短时间内完成监控系统的研制工作:
——·不同厂家对同一种设备的协议解析程度不同,从而造成它们提供的可采集或监控的项目不完全一样,而随着时间的推移,它们对设备的协议解析能力会不断提高。本系统尽力将这种因厂家造成的差异封装在应用层以下。
2.3 TELPOW系统的组网方式
——本地网中操作终端、服务器、接口机的组网方式同TELCOM系统一样,最终形成广域网。广域网的拓扑结构没有具体要求,只是要求它们之间的通信方式符合TCP/IP标准。这里重点叙述接口机到监控设备的连接方式。安徽省电信管理局选定的采集设备是中达和华为两家公司的产品。下面仅介绍它们与接口机的连接方式,如图1、2所示。
2.3.1 中达的采集设备与监控设备连接
——在中达公司提供的产品中,BCMS为电池监控专用模块;RTU为现场传统设备采集模块;UPC为万用型智能协议转换器,负责对智能设备的协议转换。在一个通信局站(SU)内。可通过这些模块实现对局站内监控项目的采集、控制,所有这些模块通过RS232/485串口和接口机连接。
2.3.2 华为的采集设备与监控设备连接
——在华为公司提供的产品中,AMS-1为智能设备处理机,它可作为SU级采集设备和智能接口设备的管理器,通过 RS232/485串口和接口机连接。华为对于非智能设备的采集方法是:通过电池监测仪BMS-1对电池组进行数据采集;通过油机监测仪GMS-1或数据采集器PMC-2、PMC-3对非智能油机进行数据采集;对于其他非智能设备,则通过PMC-2或PMC-3进行数据采集。
——需要指出的是,SU 中采集模块的多少并不一定相同,这取决于该sU希望采集的信号点数以及所选择的采集模块类型。
3 关键问题及其解决策略
——在明确系统的总体结构后,如何提供灵活的、适应全省各地的、安全可靠的监控手段是本系统设计和实现的关键。下面列举部分关键问题及其解决策略。
3.1 监控项目的确定
——通过比较技术规范中所列的监控项目以及中达、华为两家采集设备可采集到的监控项目,我们发现它们之间并不完全一致,这主要受到监控设备本身以及协议解析程度的影响。现有的一些电源监控系统往往将所能监控的项目静态地定义在程序中,这种做法显然不适应本系统的处理要求。因为:
——①安徽各地市、各局站需要监控的项目不可能完全一样;
——②对于尚未解析的设备监控项目,今后不便于扩展;
——③部分监控项目具有多级概念,如整流器输出电流分系统、架电流、组电流和模块电流等几级,具体的级数和每一级的数量在不同局站是不完全一样的;
——④需要适应今后技术规范对监控项目范围的变化等。
——为此我们设计了一种灵活的监控项目处理方法,这里只简要叙述其思想。
——(1)监控设备类的概念
——首先监控项目是按监控对象分别定义的。在本监控系统中,所监控的对象包括通信电源、空调及机房环境。由于电源部分涉及的设备种类繁多,而不同局站因规模、选型等原因会造成其设备情况不一样,为此,我们可将监控对象分类(如电源设备可根据其供电体系进行分类),大类进一步细分为小类,一些小类还可进一步分成若干子类。对于监控设备的定义必须先选定其所属
的设备子类/小类,监控设备的编号中蕴涵其所属设备类的信息。由于设备类的信息定义在表中,因此可以适应不同本地网提出的不同分类要求。
——(2)信号类的概念
——引入监控设备类后,可以缺省地定义该类设备的监控项目,我们称之为信号类。信号类引入的目的是确定该类信号的基本属性,提供用户配置的缺省值。监控项目可分为模拟量、状态量、控制量及告警量。其中模拟量是系统的遥测量,状态量及告警量是系统的遥信量,控制量是系统的遥控量。对于告警量,一般是指模拟量或状态量为某种异常情况。因此,在信号类中没有必要给出告警量的类的定义,而是提供较为灵活的配置画面让用户去配置。另外,为便于扩充。又引入“其他模拟量”、“其他状态量”、“其他控制量”。类似地,信号类的定义也在表中,可以根据情况进行调整。
——(3)信号
——按照上述方法,用户可以从已有的信号类中选择配置指定设备的模拟量、状态量和控制量,并可在已配的模拟量、状态量基础上配置告警量。对于遥测和遥信的项目,可以直接通过采集设备采集,也可通过配置的推测公式由其他项目推测而出。
3.2 监控的实时性
——本系统监控的实时性一方面取决于采集设备的性能,另一方面则在于本系统的处理策略。这里只谈后者的处理方法。关键的步骤有:
——(1)接口机定时轮回地向各个地址发送数据请求,收取应答数据。数据请求的方法一般是在第一次采集时或与采集设备通信恢复后发全取命令,而其余情况一般只取变化的。当与某采集设备通信异常时,需生成一个该采集设备通信异常的信号用于向服务器报告。
——(2)接口机端对于采集到的数据要进行预处理,即将采集数据整理成正常数字格式,乘以换算比率,加上偏移量,得到真实值。这样可节省服务器的负担。
——(3)采集分析与上发分开处理之间通过文件接口。这样,当接口机和服务器发生通信异常时,采集分析仍正常进行,其数据写入临时文件,当然文件的大小是有限制的:一旦恢复通信,则上发处理程序即可将临时文件中的数据上发。
——(4)服务器对收到的采集数据还需进一步分析,其目的主要是根据已有采集数据,计算推测点的数据,判别采集或推测得到的数据是否有告警。
——(5)为使客户端能及时地了解遥测、遥信的信息,在服务器端设置共享内存,用于存放当前的告警信息(告警板)以及各个信号的最近值。
——(6)可以为每一设备配置维护人员的BP机号码,实现在告警发生时的自动寻呼功能。
3.3 监控的层次及内容
——根据监控的角度不同,可将本地网监控层次分为按设备类和按局房两大类,整个监控层次组织成树形结构。在设备类监控方式下,节点顺序依次为地市(SC)→市县(SS)→局站(SU)→设备大类(如交流供电系统)→设备小类(如低压配电)(→设备子类(如计量柜))→设备;在局房监控方式下,节点的顺序依次为地市→市县→局站→局房→设备。在每一层均提供图形和列表两种监控方式,两者可随意切换;上下层之间可以相互迁移。在各层都会将最新告警的简要信息以状态条的方式显示在画面下方,每层的监控内容有所侧重。
——(1)地市级:主要反映所辖市县的一般、重要、紧急各级告警的数目、最高级别告警等;
——(2)市县级:主要反映下属局站的通信状态、各级告警数目、最高级别告警等;
——(3)局站级:主要反映该局站下所有已配置设备的告警情况(图形方式通过设备图标的状态及设备连接图上的动画直观地反映;列表方式下则以具体的数值给出);
——(4)设备类级:主要反映该设备类下的所有设备的告警情况(信息同(3));
——(5)局房级:主要反映所选局房内的所有设备的告警情况(信息同(3));
——(6)设备级:反映该设备的所有信号的当前状况。
3.4 统计查询的处理
——考虑到库表容量的问题。对于监控项目动态信息的记录是非周期的。只反映变化的情况,这样给统计查询增加了很大的难度。当查询跨多个局、多个设备、多个信号、多个时间段或时刻,再有求最大、最小值等的复杂要求时,如处理不当则会导致查询周期过长,用户意见很大。为此,我们的处理策略如下。
——(1)首先确定待查的设备列表、信号列表及时间段列表。
——(2)分析时间段列表条件,解析成若干个时间段,有以下几种可能:
——a)按时间段查询,保持不动;
——b)按时刻查& 无时间间隔,则解析成若干个起始和终了时间都为该时刻的时间段;
——c)按时刻查 & 有时间间隔,按照时间段查询,再按照时刻进行抽取。
——(3)按照时间段进行循环处理,同时进行多局、同类设备、多个信号查询,查询结果放在内存中。
——(4)将内存中的返回结果进行过滤、合并并重新排序(局号、设备、信号、时间),根据查询类型确定取最大、最小值。
——(5)根据初始的查询条件以及(4)中的结果,构造查询结果集。
3.5 灵活的图形监控界面
——从3.3中已看出本系统提供多层监视图,其中设备连接图在各个局站是不太相同的。为此,我们制作一个图形编辑工具,将它嵌入在配置管理里。通过它可以从已配置的设备、信号中途取构图要件,再加上图标、线型、颜色、注释、动画等的处理,最终会将图中的信息点与某些监控项目关联起来。实时监控则按配置管理所做的图形要求实现监控项目的图形显示。目前本系统能处理的动画包括,油箱→油机的油路、油机→设备的电路、蓄电池的充放电、空调的动/停、ATS
的状态、油机切换屏的状态等。
4 结束语
——由于本系统建立在 “采集设备—接口机—服务器—操作终端”模式的多层客户机/服务器的系统结构上,系统从逻辑上提供SC、SS、SU、SM的分级功能,这一模式可适应多种维护体制。从实际运行的情况来看,它完全能适应由原先的市县分别维护管理到现在的市县一体化维护管理体制的过渡。从与本地网网管系统TELCOM的综合网管来看,由于在本地网引入双机热备的服务器。两个系统可以较好地运行且互不影响,并且用户只须在自己联网的操作终端上分别安装两个系统的客户端软件,便可在自己的权限范围内同时使用两个系统,实现对本地网网管与电信动力及环境监控的综合网管功能。