吴代超
(广州哈里斯通信有限公司,广州,510665)
摘要:通过对HARRIS交换机启动信息的分析,介绍交换机初始化时各阶段的标志及可能出现的非正常表现,确定故障点并分析故障产生的可能原因。
关键词:HARRIS交换机、XCPU、HCSU、启动信息、初始化、故障定位
WU Dai-chao
(Guangzhou HARRIS Telecommunications Co.,Ltd.,Guangzhou 510665,China)
Abstract:This paper concentrated on HARRIS PBX’s reboot process .By analyzing reboot information, you can get the marks of IPL phases and identify abnormal state. At the same time, you will find out faults which frequently occur and reasons attached.
Key words:HARRIS PBX、XCPU、HCSU、 Reboot information、IPL、Fault locating
一、 引言
在设备调试与维修过程中,我们都会面对交换机的启动过程,在此过程中, 交换机会将启动信息以文本的方式输送出来,分析这些信息有助于我们了解交换机的启动进程,及时发现问题,迅速判断故障所在,缩短处理故障的时间。在下面的叙述中,我们以XCPU为例进行说明。
二、 交换机的启动涉及哪些方面
交换机能否正常启动,涉及到供电电压(交换机通过二次电源将-48V分成+/-5V,+/-12V四个电压)、公共控制背板(包括其上的各种连接电缆)、公共控制板(包括XCPU、HCSU、RMU、TTU、CTU、TSU和SSU)、接插件的接触状况、系统软件及OCR配制等,在冗余系统中,还要考虑到冗余层的相互影响。
三、 XCPU和HCSU的指示灯
在特殊情况下,如XCPU的S1口损坏或其它条件限制,我们无法从S1口了解到交换机的启动进程,这时候,我们可以借助于XCPU和HCSU的指示灯来确定交换机的启动进程。在下面我们会结合启动进程标注出指示灯点亮的顺序。
四、 如何迅速判断交换机是否正常
在HARRIS交换机中,其指示灯颜色的设置采用三种颜色,绿色为正常色,红色为故障色,黄色为标注色。
正常情况下,从交换机的前面面板观察,不应有红灯亮,正常灯亮情况如表一,如果有与下面所示不同的地方,就应检查原因。
表一:XCPU指示灯说明
标注 |
颜色 |
名称 |
含义 |
DS2 |
绿 |
HDD(硬盘) |
亮时,表示硬盘正在工作 |
DS3 |
黄 |
STANDBY(备用) |
表示系统处于备用状态 |
DS4 |
绿 |
ACTIVE(主用) |
表示系统处于主用状态 |
DS5 |
红 |
FAULT(错误) |
XCPU自检失败 |
表二:HCSU指示灯说明
标注 |
颜色 |
名称 |
含义 |
DS1 |
绿 |
ACT |
HCSU板已激活 |
DS2 |
绿 |
INT |
初始化完成,开始装载软件 |
DS3 |
黄 |
SR5 |
|
DS4 |
黄 |
SR4 |
|
DS5 |
黄 |
SR3 |
|
DS6 |
黄 |
SR2 |
|
DS7 |
黄 |
SR1 |
|
DS8 |
黄 |
SR0 |
|
DS9 |
红 |
CR ALM(失败) |
处于启动状态 |
DS10 |
绿 |
MEMORY |
内存测试通过 |
DS11 |
绿 |
SPT |
软件装载完成 |
DS12 |
红 |
AUDIT |
自检失败 |
表三:工作时HARRIS指示灯说明
公共控制板类型 |
ACTIVE层灯亮情况 |
STANDBY层灯亮情况 |
不正常时,指示灯情况 |
XCPU |
ACTIVE灯亮 |
STANDBY灯亮 |
|
HCSU |
DS1、DS2、DS10和DS11四盏绿灯亮;DS4、DS5、DS6、DS7、DS8五盏黄灯亮 |
DS1、DS2、DS10和DS11四盏绿灯亮;DS5、DS6、DS7、DS8四盏黄灯亮 |
HCSU板的DS9红灯亮,表明HCSU板所在层不正常。 |
TTU |
DS1、DS2、DS5和DS6四盏绿灯亮 |
DS2、DS5和DS6三盏绿灯亮 |
|
RMU |
无灯亮 |
无灯亮 |
RMU板有红灯亮,但电话正常,表明备用层不正常 |
表四:XCPU的S1口管脚功能说明
S1管脚编号 |
说明 |
1、7、8、9 |
Spare |
2 |
Receive Data(必接) |
3 |
Transmit Data(必接) |
4 |
Data Terminal Ready(可不接) |
5 |
Signal Ground(必接) |
6 |
Data Set Ready(可不接) |
五、 如何捕捉启动信息
XCPU的S1口是一个九针的UART标准的串行接口(说明见表四),它是对交换机系统进行紧急维护的接口(可设置XCPU的DSW2-2开关为“ON”,启动XON/XOFF协议,则在信息输出过程中,可以用CTRL-S暂停信息输出,用CTRL-Q继续信息输出)。启动时,启动信息会从此口输出,可以在此口接计算机或串行打印机将有关信息捕捉下来,连线方式如图一。
六、 交换机启动进程、常见问题及可能原因
A、初始化(IPL)
交换机是通信技术与计算机技术的结合,所以其启动过程与计算机有相似之处,另外,HARRIS交换机应用程序的文件格式是专用的,故存在一个由标准的DOS启动方式转换为HARRIS启动方式的过程。加电初始化就是完成上述两个过程。在XCPU中,完成这个过程的信息是不会从S1口输出的。而到了ICPU,这些信息可以从S1口看到。
如果加电后,XCPU的指示灯不亮、机架电源指示灯不亮或系统静止不动,则应考虑供电问题。常见的有电压偏低或负载能力不足。
HARRIS的机架电源将输入的-48V电压转换为+5V、-5.2V、+12V和-12V四个电压,而且要求其电压偏差不超过2%,否则会导致系统不能启动或不定期自动复位。如果怀疑电源负载能力不够,可以将一对或多对TSU/SSU板拨出,以减轻负载。不过,有一点要注意的是,如果系统空载,则HARRIS电源不会启动。
另外,XCPU本身的问题也会引起加电初始化失败。这里需引起注意的是,XCPU安装时,必须用力推到位,使之与背板接触良好。
B、Module Integrity Test(MIT)和System Integrity Test(SIT)
在完成加电初始化后,系统会使用常驻在XCPU中的测试程序对公共控制系统的电路板进行测试,以确定各个硬件功能块的运作是否正常,能否装载HARRIS的应用软件包。 这个测试叫Module Integrity Test(MIT)和System Integrity Test(SIT)。其中,MIT对公共控制系统的每块电路板进行功能测试,SIT对各电路板的相互通信能力进行测试.
(下面是启动信息,如果在XCPU加电大约一分钟后,仍不能从S1口收到下面的显示信息,应判断是否S1口、终端或两者之间的连线存在故障)
MIT> RESET
MIT> DRAM EN
MIT> ROM
MIT> RAM (注:以上步骤出错,为XCPU问题)
MIT> PIT
MIT> 486 Processor
MIT> 100 MHZ (注:CPU的主频)
MIT> PIC (注:此阶段出错,可能为XCPU或TTU问题,或者+/-12V电压不正常)
MIT> VERSION XCPU PROM 18:20:11 V9802A03 09/01/98
(注:这里的V9802A03是指XCPU的专用操作系统版本,此版本与系统软件的版本相对应,每套系统软件配备一张“DATA PROM”盘,用这张盘可以对XCPU的操作系统进行更新。一般高版本的专用转换程序兼容低版本的系统软件。如果PROM的版本与系统软件不匹配,在重装软件时会显示”OS ERROR”表示操作系统不匹配。另外,在冗余系统中,应保证操作系统的一致性,否则会导致意想不到的问题)
MIT> PVAM MODE (注:此处出错,由XCPU引起)
SIT> Start
SIT> Local Memory Test (注:此处出错,为XCPU问题)
SIT> Redundant Memory Test (注:HCSU的DS10亮,此处测试RMU板的内存)
SIT> Nonvolatile Memory Test
SIT> Real Time Clock Test
SIT> Fault History (注:HCSU出错,会导致此阶段出错)
VSU Reset Register contents=1
INT=FF CODE=0000 TIME=05/23/02 00:01:16 ADDR=0000:0000:00000000
INT=FF CODE=0000 TIME=05/23/02 00:01:16 ADDR=0000:0000:00000000
SIT> BOOT START (注:HCSU的DS8灯亮,XCPU的硬盘读写灯或软驱工作灯开始闪亮)
SIT> Bootstrap from device :F3: .. using file MPU.000: 02/28/02 09:08:21
............................... (注:HCSU的DS7灯亮)
(注:系统是从硬盘还是从软盘读取引导程序,可以通过XCPU前面面板的第三个开关进行设置。在这里常风的故障有:系统提示硬盘或软驱未准备好,导致无法读取,可能的原因有XCPU坏或软盘插错;如果在读取过程中,出现“e”代替“.”,则表示引导程序有错)
SIT> BOOT COMPL
SIT> EXIT Entering Kernel via initial TSS (注:HCSU的DS6灯亮)
Time Stamp: 05/23/02 09:29:28
***IPL FSIDE > Model number: SanDisk SDP3B-256
FSIDE > Firmware revision: vdd 1.00
v3.0***
C、装载HARRIS的系统文件及数据库文件
在这个过程中,可能会两种异常情况:
a、出现文件读写出错的提示,出错的文件可能是系统文件,也可能是数据库文件。有些出错的文件并不会影响系统的正常启动,这时系统会忽略所出现的错误,继续前进,有些文件出错,会立即引起系统重新复位。如果是系统文件出错,只能从软盘中重新装载系统软件;如果是数据库文件出错,又不影响正常启动的情况下。可以在系统启动完成后,再将备份的数据库拷贝回去。
b、装载过程中系统出现不正常的长时间停顿,然后系统重启动,出现这种情况,是系统硬件有故障引起的。需检查HCSU、TTU或冗余系统。
重要提示:在上面,我们提到备份数据库,每个用户的数据库都是不相同的,就如在计算机中一样,定期备份数据库并做好标识是一个良好的习惯(不然的话,出问题时,谁都没办法帮你)。另外,在HARRIS交换机中,系统设置两个相互独立的数据库,在实际调试中,我们可以充分利用闲置的数据库,作为另一个数据库的在线备份,或是数据调试过程中,恢复旧数据库的快捷途径。
(下面是启动信息)
************************************************************************
* Harris Call Processing Task Loading IPL Command File *
* For multi-processor systems *
************************************************************************
(注:以下开始从硬盘中将文件调入内存,主用层HCSU的DS4灯亮,RMU板的红灯灭,XCPU的硬盘工作灯闪烁,如果硬盘工作灯常亮不闪,是不正常现象。)
Task #16: SLT_______ 02/28/02 10:59:28
M:\G260005\support\slt\src\slt.bld loaded from file :tk:slt.nsy
tss:1400 tcb:1408 ldt:1410 entry:1410:200:07590
sys_mbx_capacity:3 tel_mbx_capacity:0 GLOBAL REDUNDANT
Active Database file extension is .DBB;1 (注:数据库B被激活)
MH-INFORMATION, 000006a4: LAN A - IO: 280 IRQ: 3 Memory Mode
MH-INFORMATION, 000006ae: LAN A failure detected
MH-INFORMATION, 000006c2: LAN B - IO: 2c0 IRQ: 5 Memory Mode
MH-INFORMATION, 000006cc: LAN B operational
(注:显示网卡A和网卡B的地址、中断,并对)网卡的工作状况进行测试,这里记录的信息告诉我们,网卡A退出服务,网卡B工作正常)
Task #17: SPOOL_____ 02/28/02 11:02:26
M:\G260005\support\spool\src\spool.bld loaded from file :TK:SPOOL.NSY
tss:13A0 tcb:13A8 ldt:13B0 entry:13B0:200:03070
sys_mbx_capacity:14 tel_mbx_capacity:0 GLOBAL REDUNDANT
D、激活任务
到这一步,系统根据已调到内存中的文件激活用户的任务,在激活任务的过程中,涉及到系统内存的大量占用,所以,在这里易出现的故障是内存资源不足(包括XCPU的内存或RMU板的内存),这一般在系统软件升级或OCR升级时出现。HARRIS交换机的OCR相当于一把软件锁,由其控制软件能否被使用,为避免出错,其设计成只能往上升不能往下降,OCR控制的软件一旦开放,在激活数据库后,系统就会给其分配内存资源,而不论其是否被使用,所以不合理的OCR的配置,不但增加了系统运行的负担,而且为以后的升级埋下了隐患。
(下面是启动信息)
Ram disk device is <>
Waiting for goahead from Active Side
Enable RAP
Enable CAP
Enable TIS
Enable CAP timer
E、注册有效性检查
在24版以上软件,软件每次重新安装后,要求在临时注册15天内进行正式注册。否则会导致系统的重新复位,并在重新启动后,会在最后停滞不前,不能激活用户的部分任务。
(下面是启动信息)
CRG - from :DB:MANUAL.DB;1, :CF:CRG.DBB;1
Enable Ndirt (HCSU的DS11灯亮)
Enable SMS
Enabling network controls
No network controls
Initializing devices for CDR
(下面是启动过程完成信息)
*********************************************************************
* IPL complete -- Call Processing w/ Editor Database MPU *
*********************************************************************
至此启动完成,HCSU的DS9指示灯熄灭,DS5灯和DS1灯点亮,系统处于正常状态。
七、 结束语
HARRIS交换机的启动过程随着使用的机型、CPU、OCR的配制以及软件版本的不同而在细节上有所区别,但整个结构是相同的,而且产生启动中断的原因并不局限于上述已介绍的这些,这还需我们不断地去发现、去总结。
作者简介:吴代超,男、1969年6月、湖南平江人、工程师,长期从事售后服务管理、HARRIS设备的维护及技术咨询。主持和参与多个电力数字程控交换机组网和电力调度网的安装、调试工作。