通信人家园

 找回密码
 注册
搜索
热搜: 家园 活动
恒扬科技
查看: 409|回复: 0

[工程管理] 数据中心网络维护三把斧 [复制链接]

军衔等级:

  新兵

注册时间:
2012-8-9
发表于 2017-2-14 15:39:18 |显示全部楼层

第一把斧:网络流量分析

数据中心网络并不关心应用层的内容,只完成数据流量的交互,这样对流量的走向分析尤为重要。要对整个数据中心网络里所有链路流量进行监测,当故障发生时,能够迅速锁定故障范围和位置,这些故障最早在流量图上就可以反映出来,所以流量分析软件,对于数据中心网络维护必不可少。选择一两款使用广泛的流量分析软件部署到数据中心网络中,灵活启动不同层面(接入层、汇聚层、核心层)的网络设备进行流量信息采集,不需要改动现有的网络结构,实现对数据中心网络流量信息统计和分析功能,能够及时了解各种网络应用占用的网络带宽,各种业务消耗的网络资源,可以帮助网络维护人员及时发现网络瓶颈,防范网络病毒的攻击,并提供丰富的网络流量分析报表。

第二把斧:网络监测分析

数据中心网络只要确保流量送达目的设备,就完成了自己的使命,这个运送过程是否有问题,需要通过监测手段来确定。一般我们判断一个网络是否有问题,往往需要借用一些探测工具,比如:PING、TRACERT、SNMP、SYSLOG等工具。通过PING和TRACERT可以快速确认故障位置和设备,以便对故障设备进行深入分析。通过SNMP和SYSLOG可以获取到故障设备运行的基本信息,很多时候通过设备报出的SYSLOG信息就可以确认设备故障的原因。很多数据中心将这些工具都固化到网络监测软件中,这样可以有效地预防或发现故障,警报将通过声音、短信、微信等方式显示报警框、发送Mail等方式及时发送相关人员,或自动运行相应的程序进行故障处理,提供全方位的告警监测、统计分析和报警定位。

第三把斧:网络故障分析

当用了前两把斧,故障分析依然没有头绪,就需要用上这第三把斧,对故障进行深入分析。这时还是要借助于从以上两点获得的网络基本情况,对故障表现有了基本了解。网络故障表现反映到PING业务上无非三个现象:不通、丢包、延迟大。三个现象衍生出来各种各样的网络问题,根据三个故障现象接着分析。首先,不通那一定是转发表项或者数据通路上出了问题,要沿路检查二三层转发表项、端口、VLAN、链路这些设备信息,看是否有设置错误的地方,再有就是不通也可能是连接设备直连的链路出现了断路,这个不仅指设备外部之间连接的链路、模块,也包括设备内部的连接,有的框式设备内部流量要经过很多块板卡,内部互连出了问题也会影响到转发,有的盒式设备,流量进入设备后,还没有处理就在端口的连接器上将报文丢弃掉了,这些都会造成不通;其次,丢包一定是转发表项不稳定或者数据通路上不稳定造成的问题,还是要将转发表项和数据通路都检查一遍,但是更加关注的是转发表项的稳定性,是否有变化,数据通路上更加关注是否有错包、MAC地址迁移、STP切换等故障表现;第三,延迟大那一定是数据通路上出现了拥塞,数据流量超过了网络通路上能提供的最大带宽,这时要沿路查转发通道,看是否有拥塞丢包,端口流量是否有超线速、限速情况,这些故障会导致业务层面延迟大,延迟大对应用业务伤害蛮大的,访问体验感超级差,尤其是视频业务,会导致画面不流畅,观赏性变差。



使用道具 举报

您需要登录后才可以回帖 登录 | 注册

Archiver|手机版|C114 ( 沪ICP备12002291号 )|联系我们 |网站地图  

GMT+8, 2017-5-27 12:28 , Processed in 0.093600 second(s), 14 queries , Gzip On.

Copyright © 1999-2017 C114 All Rights Reserved

Discuz Licensed

回顶部