前言
在通信行业迅猛发展、
市场竞争日益激烈的今天,
电信运营商的竞争力主要表现在服务能力上的竞争,而保持设备性能的稳定是提升运营服务质量的重要手段,大通道的安全畅通尤为重要。
在大通道的维护中,经常出现一些业务中断、通道误码、设备对接问题,依据告警产生信号流程图可以迅速准确地定位并排除故障,下面我提出一些常见故障的处理过程及分析。
SDH告警产生信号流程如图1所示:

1 误码告警
1、1 系统
西安铁通城域网主环是四纤双向复用保护环,北环是二纤双向复用保护环,网管在南郊。东村至北郊有2M业务。城域网部分拓扑如图2所示:

1.2故障现象及处理
用户反映东村-北郊2M业务有误码,影响使用。网管查看发现北郊站与东村间2M互告LP-BBE。同时材料厂站7板位主用交叉板有温度越限告警,查询其性能后看到温度为72℃,8板位备用交叉板无告警,温度为40℃,属于正常温度范围;查询PMU板性能,温度为42℃。业务走7板位,由此怀疑是主用交叉板温度高造成通道误码,网管做主备用交叉板倒换操作,倒换后误码消失,业务恢复正常。第二天去材料厂,发现机房空调未开,环境温度为30℃,查看防尘网,发现防尘网过脏,防尘网冲洗后网管监测交叉板7板位温度慢慢降下来,业务改走7板位,业务正常。
1.3 故障分析
业务信号流向为:东村-材料厂-北郊 。北郊站与东村间2M互告LP-BBE。产生低阶误码有能是:⑴高阶通道影响; ⑵设备温度; ⑶设备接地。而网管上无其他高阶告警,北郊站、东村与其他站2M业务正常,故可排除设备接地和高阶通道影响;材料厂主用交叉板温度过高是引起北郊站与东村间2M有误码的主要原因。
为何主备用交叉板温度相差30℃呢?因为材料厂1-7槽位为满配置,而8-15槽位仅配置:8槽位XCS板,15槽位SCC板,由于环境温度过高,并且防尘网过脏,致使交叉板温度相差较大。
1.4 建议
注意机房环境卫生,防尘网至少一周清扫一次。有条件的机房应做到24小时开空调,以保证环境温度在22-26℃,湿度在40-65%。
2 设备对接告警
2.1 系统构成
汉西阳环2 为155M 单向通道保护环:武汉-西安间走西南环,使用
华为2.5G设备;西安-阳平关间走西成2.5G,使用中兴2.5G设备;阳平关-武汉间走武阳2.5G,使用中兴2.5G设备;武阳2.
5G走武汉-安康间业务,西安-阳平关通道作为武汉-安康业务的保护通道,正常情况下西安-阳平关断开不影业务。拓扑图见图3所示:

2.2 故障现象:
西南环北二环1板位SLO1-2出现B3-SD告警。
2.3 故障处理
将西南环北二环1板位SLO1-2自环,西南环告警消失。西南环上武汉环回,西安用718表测15分钟无误码,说明西安-武汉西南环通道正常。西成2.5G阳平关端口对西安环回,用718表测15分钟无误码,说明西成2.
5G设备通道正常。
网管在武阳2.5G阳平关端口对西安环回,用718表测15分钟无误码,说明武阳2、5G阳平关端口至西安正常。武汉业务走武阳2.
5G运行正常。
西安站将光纤放通后,B3-SD告警出现,怀疑为两个厂家对接时B3开销字节的设置问题,中兴2.
5G设备B3字节设置为穿通状态,问题可能出现在
华为设备上。申告北京网管,北京网管将西南环B3字节终结改为穿通后,告警消失。
2.4 故障分析:
依据SDH告警信号产生流程图可知,B3字节的告警属于高阶开销处理器和指针处理器这一模块中的开销字节问题,仅影响某一个高阶通道,根据这一点我们可以诊断出,此故障与西南环大通道无关,只是一个155通道的问题。
测
华为西南环155通道西安至武汉好,西成2.
5G西安至阳平关通道也好,但是两家设备对接后,出现B3-SD告警,只有怀疑到B3字节的设置问题。开销字节在网管上可以设置,有三种方式:
开销检测
开销在发送端生成,开销检测在接收端完成。线路板对开销字节进行提取,并根据所提取的值上报相警。
⑵ 开销终结
指传输设备对开销进行检测后再将其标记为自身默认值进行发送。发送给对端设备的则是重新生成(或缺省)的开销。如开销字节不匹配会上报相关告警。
⑶ 开销穿通
指传输设备对接收到的开销不进行检测后,直接转对端站,因此在对接时只要对接任一方开销
设为穿通,那么即使开销字节不匹配,对接双方设备都不会上报告警,也不会影响业务。
B3开销字节在中兴西成2.
5G设置是穿通,中兴设备对开销字节不检测不处理。西南环
华为设备西安站此端口设置为终结,对B3字节检测并处理,网管上报B3-SD告警,北京网管将B3字节改为穿通后,告警消失。
2.5 结论
在处理故障时,根据信号告警产生流程图能迅速准确地定位故障及影响范围,在两个不同厂家设备对接时要注意开销字节的设置,否则就会引起告警,甚至影响业务。例如:西安-延安北
互联网155开通时C2字节的设置问题导致开通业务时测试通道不通,厂家用命令行在网管上修改C2字节后,通道测试正常。
3 线路故障
3.1 故障现象
网管告警发现西北环西安-咸阳发生瞬断三次,网管查询西安收咸阳有LOS告警,PA、BA板已经闭光,1、2、3、4、6、8环业务倒换,判断为线路故障,将通道倒入备纤,告警消失,业务恢复。
3.2 故障处理:
用OTDR测线路,在西北环西安-咸阳光纤双纤中一根纤中,存在-4.7dB的插损,通知有关人员前去处理,处理完毕后测试线路良好.设备倒回原通道,运用正常。故障原因为:在ODF架尾纤整理中捆扎过紧,导致尾纤曲率半径过大,解开后恢复。
3.3 故障分析:
西北环有自动闭光功能。如图4所示:

如果线路上双纤中的一根断了,本地监测到一个丢失的信号LOS告警,如信号持续550ms,本地设备反方向的激光器会被关闭,将引起远端设备监测的LOS告警,与此同时光保护功能将起作用。因此,此故障判断为光纤故障。
3.4 故障结论:
此故障判断比较容易,但是大通道中断造成的影响比较大,因此在维护中要特别注意光纤放置位置,捆扎松紧程度,防止因为挤压光纤造成的通道故障。尤其是波分设备,它对线路质量要求比较高,功率值与原始值相差只有±2dB左右的容忍度,维护时要特别注意。
4 总结
对一个大通道维护人员来说,在日常工作中有可能遇到形形色色的故障,依照SDH信号告警产生流程图,可以迅速准确地定位故障、排除故障。维护人员只有在维护过程中仔细观察,合理推测,不断积累经验,准确判断,迅速处理,确保通信大通道业务的安全畅通,才能使我们在激烈的
市场竞争中站稳脚跟。
作者简介: 孟桦 毕业于西安电子科技大学,在铁通西安分公司维护中心传输室工作。