从事网管工作多年,遇到的各种网络故障疑难杂症也不乏百例,下述的故障案例虽具有一定的特殊性,却也能带给我们关于网络故障排查的一些启示。
故障发生
2008年12月,某钢铁集团公司,网络采用星型拓扑,总部信息中心机房核心交换机连接到下属子公司的汇聚交换机,然后通过约2.5km的单模光纤与子公司的操作室进行连接,两端通过光电转化器传输数据。某日,操作室人员告知不能上网。
初步排查
中心机房的网管人员立即用排查的方式检查二层链路,汇聚交换机Ping核心交换机正常,因此,很有可能是外线的光纤链路出现了问题。分别看子公司和操作室的收发器指示灯信息,子公司的光纤收发器RX(收光)灯亮,TX(发光)灯不亮,ACT灯偶尔闪,操作室一侧的光纤收发器RX(收光)灯不亮,TX(发光)灯亮,ACT灯不亮,表示操作室只有发信号没收信号。接下来,在两端把收发光纤都互相交换,现象是子公司RX灯不亮,TX灯亮,操作室RX灯亮,TX灯不亮。因此,初步判定有一芯光纤出现故障。
进一步排查
由于该段光缆走的是地下管道,两端作引上,人为损坏可能性不大,因此,判断两端光终端盒或尾纤出问题的可能性较大,于是重新熔接尾纤,做两端的终端盒。然后用红光笔测试,两芯都能够收到光,表示终端盒、尾纤、光缆均正常。接上光收发器后,两端的光收发器的收光灯都不亮。用FlukeNetworks公司的光源和光功率计测试两芯光纤也都不通。这样的结果比较奇怪。因为一般来说,红光笔能够测通,光缆肯定没有问题,而现在红光笔能够测通,但光表却不通,反复测试了几次,结果依旧。为了解决这个故障,借来了FlukeNetworks公司的单/多模光纤故障分析仪,采用OTDR(光时域反射器)进行深度测试,结果是从子公司一端测试故障点在2.4km处,从操作室用户端测,故障点在50m处,于是顺着光缆检查,发现暗井中光缆引上的部分结有冰块,敲开冰块后发现光缆有裂痕,推测有水渗入光缆后冻成了冰,冰把缆芯挤裂,因为有冰,红光笔发出的650nm的荧光可以穿过,而光源和光功率计1310nm的激光被折射,所以导致用红光笔可测通,用光表却测不通的现象。
故障解决
将暗井内被挤裂的缆芯熔接上,又经过了光功率计的测试,光纤链路恢复了正常。
启示
只有用得当的方法,才能发现问题的本质,好的工具可以真正做到“兵来将挡,水来土掩”。