zl程序教程

您现在的位置是:首页 >  Java

当前栏目

网络设备的运行隐患怎么排除?日常的例行维护绝对不能少,收藏本文,轻松拿捏各种场景

2023-02-18 16:28:51 时间

设备稳定运行一方面依赖于完备的网络规划,另一方面,也需要通过日常的维护发现并消除设备的运行隐患。

日常维护怎么才能进行呢?有哪些必要的步骤呢?

记住这五步:

1、设备环境检查

设备运行环境正常是保证设备正常运行的前提

检查的时候遵循以下步骤:

下面我们来详细介绍一下每个步骤需要注意的点:

1.1 设备位置摆放是否合理、牢固

设备应放在通风、干燥的环境中,且放置位置牢固、平整,远离热源。设备周围不得有杂物堆积。

1.2 机房温度状况

机房温度:0℃~40℃。

1.3 机房湿度状况

机房湿度:5%RH~90%RH。

1.4 机房内空调运行是否正常

空调可持续稳定运行,使机房的温度和湿度保持在设备规定范围内。

1.5 清洁状况

  • 注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。
  • 设备本身应无明显灰尘附着。
  • 有效的防鼠措施,避免小动物(如蟑螂等)进入。

1.6 接地方式及接地电阻是否符合要求

  • 一般要求机房的工作接地、保护接地、建筑防雷接地分开设置,因机房条件限制,可采用联合接地。
  • 设备的接地线连接至接地排的接线柱上时,接地电阻应小于5Ω。
  • 设备的接地线连接至接地体上时,接地电阻应小于10Ω。
  • 当环境不具备接地条件时,可将设备的接地线相连,保持几台设备的带电压差一致。

1.7 电源连接是否正常可靠

电源线应正确的连接到设备的指定位置上,且连接牢固。设备的电源指示灯应常亮绿色。

电源插线板质量可靠,有CCC安全认证。

1.8 供电系统是否正常

要求供电系统运行稳定。直流额定电压范围为–48V DC~–60V DC。交流额定电压范围为100V AC~240V AC。

1.9 酸碱状况

无金属生锈、PCB板腐蚀,连接器没有锈蚀。

1.10 防雷状况

  • 串口线缆不存在室外走线。
  • 以太网电缆不存在室外走线。

1.11 安装规范性

  • 没插接口模块的槽位安装有假拉手条。接口模块、假拉手条、电缆拧紧固定螺钉。
  • 各种电缆的绝缘层避免接触高温物体。
  • 各种电缆分类整齐并绑定,并保证一定的自由度,能够防止误插拔。电源线不能和信号线捆扎在一起。
  • 未使用的光口有堵头。

2、设备基本信息检查

检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。

检查的时候遵循以下步骤:

下面我们来详细介绍一下每个步骤需要注意的点:

下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。

2.1 设备运行的版本

单板PCB版本号、软件版本号与要求相符。

执行命令:

display version

2.2 检查软件包

检查下述系统文件名是否正确:

  • 当前启动大包名
  • 下次启动大包名
  • 备份大包名
  • 配置、许可文件、补丁、语音的当前启动文件名和下次启动文件名

执行命令:

display startup

2.3 License信息

  • 查看GTL License文件名、版本及配置项是否符合要求,确认是否需要升级。
  • “Masterboard licensestate”项为“Normal”。“Masterboard licensestate”项为“Demo”或“Trial”时,确认License在有效期内。

执行命令:

display license

display license state

2.4 检查补丁信息

  • 补丁文件必须与实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。
  • 补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。

执行命令:

display patch-information

2.5 检查系统时间

  • 时间应与当地实际时间一致(时间差不大于5分钟),便于故障时通过时间精确定位。
  • 如果不合格,请在用户视图下执行clockdatetime命令修改系统时间。

执行命令:

display clock

2.6 检查Flash空间

Flash里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved命令删除。

执行命令:

dir flash

2.7 检查SD卡空间

SD卡里的文件都必须是有用的,否则请在用户视图下执行delete /unreserved命令删除。

执行命令:

dir sd0

2.8 信息中心

“InformationCenter”项为“enabled”。

执行命令:

display info-center

2.9 检查配置正确性

通过查看当前生效的配置参数,验证设备配置是否正确。

执行命令:

display current-configuration

2.10 检查debug开关

设备正常运行时debug开关应该全部关闭。

执行命令:

display debugging

2.11 检查配置是否保存

当前的配置和下次启动的配置文件内容一致。

执行命令:

compare configuration

2.12 检查网络连通性

设备之间互通正常。

执行命令:

ping

tracert

3、设备运行检查

检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。

检查的时候遵循以下步骤:

下面我们来详细介绍一下每个步骤需要注意的点:

下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。

3.1 单板运行状态

重点关注单板在位信息及状态信息是否正常。

  • 单板“Online”为“Present”。
  • 单板“Power”为“PowerOn”。
  • 单板“Register”为“Registered”。
  • 单板“Alarm”为“Normal”。

执行命令:

display device

3.2 设备复位情况

通过查看复位信息(包括复位时间、复位原因),确认无非正常复位。

执行命令:

display reset-reason

学习更多网络技术,欢迎关注【网络技术联盟站】

3.3 设备温度

各模块当前的温度应该在上下限之间,即“Temperature”的值在“Upper”和“Lower”之间。

执行命令:

display temperature all

3.4 风扇状态

Present项为YES表示正常。

执行命令:

display fan

3.5 电源状态

State项为Supply表示正常。

执行命令:

display power

3.6 FTP网络服务端口

不使用的FTP网络服务端口要关闭。

执行命令:

display ftp-server

3.7 告警信息

  • 无告警信息。
  • 如果有告警,需要记录,对于严重以上告警需立即分析并处理。

执行命令:

display alarm active

3.8 CPU状态

各模块的CPU占用率正常。如果CPU占用率如果超过80%,建议重点关注。

执行命令:

display cpu-usage

3.9 内存占用率

内存占用情况正常,如果“Memory Using Percentage Is”超过60%时需要关注。

执行命令:

display memory-usage

3.10 日志信息

不存在异常信息。

执行命令:

display logbuffer

display trapbuffer

4、接口内容检查

检查设备的接口信息,如接口协商模式、接口配置、接口状态等是否正确。

检查的时候遵循以下步骤:

下面我们来详细介绍一下每个步骤需要注意的点:

下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。

4.1 接口错包

业务运行时,要检查接口有无错包,包括CRC错包等。

执行命令:

display interface

4.2 接口配置

接口的配置项合理,如接口双工模式、协商模式、速率、环回配置等。

执行命令:

display interface

4.3 接口状态

接口的Up/Down状态满足规划要求。

执行命令:

display interface brief

4.4 PoE供电

PoE供电状态正常,“Portpower ON/OFF”为“ON”的接口,其“Port powerstatus”为“Delivering-power”。

执行命令:

display poe power-state interface interface-type interface-number

5、业务检查

检查设备运行的业务是否正常。

检查的时候遵循以下步骤:

下面我们来详细介绍一下每个步骤需要注意的点:

下述检查方法中涉及的命令如无特殊说明,均可在所有视图下执行。

5.1 组播

成员接口和路由器接口信息

静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。

执行命令:

display igmp-snooping port-info
报文统计信息

VLAN发送的IGMP报文个数,接收的IGMP报文和PIMHello报文个数,以及所有VLAN内发生的二层事件次数统计合理。

执行命令:

display igmp-snooping statistics vlan
转发表信息

组播转发表项正确。

执行命令:

# 查看二层组播转发表项:
display l2-multicast forwarding-table vlan vlan-id

# 查看三层组播转发表项
display multicast forwarding-table
组播路由协议
  • 域内组播路由协议采用PIM-SM。
  • 与组播相连的接口都必须要使能IGMP。

执行命令:

display multicast routing-table

5.2 IP 业务

IP流量统计信息
  • 单次采集的错包和TTL超时报文数小于100。
  • 正常情况下,两次采集的错包数和TTL超时报文数没有增长。

执行命令:

display ip statistics
ICMP流量统计信息

“destination unreachable”和“redirects”项不超过100。

执行命令:

display icmp statistics
IP地址池信息

“Conflict”项为0。

执行命令:

display ip pool
NAT ALG的使能情况

确认“dns”、“ftp”、“rtsp”、“sip”项的使能状态“status”是否符合自身业务需求。

执行命令:

display nat alg
NAT Server配置信息

公网地址和服务端口号GlobalIP/Port、私有地址和服务端口号Inside IP/Port配置正确,符合自身业务需求。

执行命令:

display nat server
NAT流表信息

确认NAT转换后的“NewSrcAddr”、“NewSrcPort”、“NewDestAddr”和“NewDestPort”项符合自身业务需求。

执行命令:

display nat session all verbose

5.3 广域网

PPP协议状态

“current state”项为“UP”时,“Line protocol current state”项需为“UP”。

执行命令:

display interface serial
FR协议状态

“current state”项为“UP”时,“Line protocol current state”项需为“UP”。

执行命令:

display interface mfr
MP捆绑链路情况

捆绑的链路数正确。

执行命令:

display ppp mp

5.4 3G/LTE

呼叫连接信息
  • “Current Service Status”项为“Service available”。
  • “Packet Session Status”项为“Active”。

执行命令:

display cellular interface number all

5.5 可靠性

备份接口状态

备份接口的物理状态为“down”。

执行命令:

display interface brief
VRRP状态
  • “State”不为“Initialize”状态。
  • 备份组中的设备的VRRP状态“State”不能同时为“Master”。
  • “Checksum errors”、“Versionerrors”和“Vrid errors”为零。

执行命令:

display vrrp

display vrrp statistics
BFD Session状态

所有BFD Session的状态为Up。

执行命令:

display bfd session all verbose

display bfd statistics

5.6 MSTP

MSTP状态
  • 指定端口和根端口的“STP State”为“FORWARDING”。
  • 备份根端口的“STP State”为“DISCARDING”。

执行命令:

display stp brief
MST域配置信息

域名、域的修订级别、VLAN与生成树实例的映射关系以及配置的摘要符合要求。

执行命令:

display stp region-configuration
MSTP拓扑变化
  • 查看MSTP拓扑变化相关的统计信息。
  • 如果设备拓扑变化次数递增,则可以确定网络存在震荡。

执行命令:

display stp topology-change
TC/TCN报文收发计数

正常情况下,两次数据应该无增长或增长很少,表示实例端口状态稳定。

执行命令:

display stp tc-bpdu statistics

5.7 路由信息

路由表信息
  • 具有默认路由或者其他精确路由,便于故障时候可以远程定位。
  • 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。

执行命令:

display ip routing-table
OSPF错包情况

正常情况下,两次的数据没有增长。

执行命令:

display ospf error
OSPF邻居状态

OSPF邻居状态:

  • 邻居状态“State”为“Full”。
  • 正常情况下,没有邻居down掉。

执行命令:

display ospf peer
IS-IS邻居状态

IS-IS邻居状态:

  • 邻居状态“State”为“Up”。

执行命令:

display ospf peer last-nbr-down
BGP邻居状态

BGP邻居状态:

  • 邻居状态“State”为“Established”。

执行命令:

display bgp peer
OSPF Router ID
  • 指定Router ID为Loopback口地址。
  • 如未分配Loopback口地址,则要指定为上行口地址或其他Down掉概率最小接口的地址。

执行命令:

display current-configuration configuration ospf
OSPF路由引入配置

尽量使用Network方式发布路由,也可以通过import方式引入路由。

执行命令:

display current-configuration configuration ospf
OSPF虚连接

邻居状态“State”为“Full”。

执行命令:

display ospf vlink
OSPF STUB区域

STUB区域,不能使用Import方式引入路由。

执行命令:

display current-configuration configuration ospf
BGP路由发布
  • 不建议采用import-route protocol 命令发布IP路由。
  • 应使用network{ ipv4-address | ipv6-address prefix-length 命令和ip route-static ip-address { mask | mask-length }null0命令手工聚合路由后再静态发布。

执行命令:

display current-configuration configuration bgp
IBGP邻居

基于协议稳定性的考虑,建议使用Loopback这类状态总为UP的接口建立邻居关系。

执行命令:

display current-configuration configuration bgp

5.8 L3VPN

VPN路由信息

确认路由表项中有去往对端CE的路由。

执行命令:

display ip routing-table vpn-instance vpn-instance-name
VPN实例发出/收到的路由属性

Export VPN Targets和Import VPN Targets配置正确。

执行命令:

display ip vpn-instance verbose

5.9 WLAN

AP信息

“State”项为“Normal”。

执行命令:

display ap

总结

本文给大家介绍了设备例行维护的命令大集合,整理花费了大量的时间,请大家多多转发,多多点赞!