思博伦通信数据中心网络整体分析方案

1 引言

数据中心(Data Center,DC)为各种企业业务提供数据,是数据计算、网络传输、存储的中心。数据中心是当前运营商和各行业的IT建设重点,实现对IT信息系统的整合和集中管理,提升管理、运营和服务效率,降低运营成本。这也导致数据中心规模越来越大,复杂度越来越高。为了建设集中扁平化,统一多种应用的融合数据中心,未来的数据中心建设将围绕融合网络和虚拟化展开,大量新技术应用在数据中心建设中,如数据中心以太网,FCoE,虚拟化,各种应用服务器建设等。新技术的验证和性能评估是新的数据中心部署的第一步,因此在测试中,除了对单一技术进行测试外,还需要和其他新旧组件结合起来,进行集中的整体分析。思博伦通信推出业界第一个整体数据中心测试解决方案。本文从数据中心网络基准性能测试方法,数据中心以太网测试,FCoE测试,虚拟化测试等方面,对思博伦数据中心网络整体分析解决方案进行论述。

2 基准性能测试

在论述推动数据中心发展的新技术测试之前,本文先回顾基本的基准性能测试概念,这些测试是数据中心设备最基本的测试项目。这些测试概念将在后文各种数据中心技术的测试中发挥重要作用。

基准性能包括可重复(Repeatability)、可重现(Reproducibility)、高压力(Stressful)和有意义性(Meaningful)。

(1)可重复:在同一测试床下对同一测试的多次运行,应该得到近似的结果。

(2)可重现:类似于Repeatability,但是指在不同的测试床下,用相同型号、相同版本的测试仪表和被测设备进行相同的测试,应该得到近似的结果。

(3)高压力:基准性能能够反映被测系统的性能极限。如吞吐量指标,反映的是在没有丢包情况下的最大转发速率。

(4)有意义性:这是最难达到的目标。一个测试会得到很多测试数据,但是并不是所有数据都和测试目标相关联。比如测试两台路由器的时延,分别得到10?s和100?s的结果。假如这两台路由器是部署在一条非常长距离的链路的两端,链路本身就会引入10~100ms时延,而且承载的是普通数据业务为主,那么这90?s的时延差距可能意义不大,而如果两台路由器是部署在数据中心中一条1m线的两端,承载的是事实性很强的金融交易业务数据,那么10倍的时延降低就变得非常有意义。

根据以上法则以及其他有效的测试技术,形成了一系列基准性能测试标准,定义了基准性能和基准性能测试方法。这一系列标准对包括数据中心系统和设备在内的网络设备都非常有效。这系列标准包括:RFC 1242/2544,定义网络和网络设备的基准性能测试术语和测试方法学;RFC 2432/2889,定义以太网二层交换机基准性能测试术语和测试方法学;RFC 2432/3918,定义组播基准性能测试术语和测试方法学;RFC 2647/3511,定义防火墙基准性能测试术语和测试方法学。其他一些对数据中心测试非常有用的测试标准有:RFC 5180,定义了RFC2544在IPv6上扩展;RFC 4814,为测试推荐了测试中伪随机流量模式,这种模式有别于过去传统测试工具产生的静态的模式,是一种更真实的模式;RFC 4689,定义网络层QoS测试术语。

Spirent Testcenter为上述所有基准性能测试提供了标准自动化测试套件,图1是RFC 2544和RFC 2889的自动化测试套件截图。

图1 RFC 2544和RFC 2889自动化测试套件

除了标准的RFC 2544和RFC 2889支持之外,Spirent Testcenter提供了很多对于数据中心有效的测试扩展。

●基准性能测试标准中定义的测试是固定帧长的测试。一般说来,大帧的表现会超过小帧。但是现网中的流量中包含各种帧长,所以有了一个概念:Internet混合帧长(IMIX),在IMIX模型中,用户可以根据自己的应用定义不同帧长的数据帧的比例关系(见图2)。Spirent Testcenter除了提供传统的固定帧长测试之外,还可以完成随机帧长和IMIX的基准性能测试。

图2 RFC 3393 Jitter原理图

●巨型帧(Jumbo Frame)的基准性能测试。传统的以太网帧最大帧长是1518字节。而数据中心业务很多传输的是大块数据,所以作为传统数据中心的传输技术,Fibre Channel帧最长为2112字节。当Fibre Channel在以太网上承载的时候,为了避免分片带来的额外开销,数据中心以太网(Data Center Ethernet,DCE)要求支持帧长为2.5kbyte的Jumbo Frame。Spirent Testcenter能够支持最大达16kbyte的巨型帧,能够支持Jumbo Frame的基准性能测试。

●随着实时业务的增加,一些能有效反映实时业务质量的统计量被越来越重视。比如抖动,RFC3393和MEF 10对抖动提供了标准的定义:It’s defined as absolute value of difference between Latency A and Latency B,Spirent Testcenter能在基准性能测试的同时,测试出不同负载下的抖动。

数据中心网络要求帧的顺序传递,乱序帧会导致重新排序,大大降低性能。RFC4737/MEF 10对帧的顺序性提供了明确定义。Spirent Testcenter是目前惟一支持RFC 4737/MEF 10帧的顺序定义的测试仪表。

在任意拓扑之上的基准性能测试。在传统测试中,基准性能测试和协议测试往往是分开的,这造成在进行某一项单一测试的时候,系统中的所有资源都在为这项测试服务。而现网中,协议平面和数据转发平面是同时运行的。Spirent Testcenter能够协议平面和数据转发平面测试结合起来,能够先建立协议平面拓扑,然后在这个拓扑之上运行基准性能测试。比如,可以先在测试端口之间建立FCoE Session,然后在这些Session之上,运行FCoE数据的RFC 2544测试。另外,Spirent Testcenter能够每端口产生32k条独立测试流,每端口实时分析64k条独立的测试流。一个端口发送出来的测试流,能够模拟经过RR调度,WRR调度和绝对优先级调度的测试流量。在数据中心以太网测试中,能非常好地测试数据中心以太网流量的优先级区分功能和QoS能力。

Spirent Testcenter提供了业界最高的测试精度,其测量时戳精度为10ns。而且Spirent Testcenter提供了业界最好的补偿算法。其任何类型的端口,包括10Mbit/s,100Mbit/s,1G和10G接口在任何帧长、任何负载下的自环时延,都在0.3?s以下。数据中心以太网设备基本转发时延基本都在?s级别。Spirent Testcenter自有时延可以忽略,而且由于各种接口的自有时延一致,进行不同类型接口之间互通测试(如千兆接口和万兆接口之间互通测试)不存在时延无法补偿问题。由于数据中心设备的转发时延和抖动要求非常高,所以Spirent Testcenter的测试精度和时延补偿算法对数据中心测试来说非常重要。

作为基准性能测试领先的测试工具,Spirent Testcenter在2008年9月和Network World一起完成了Cisco Nexus 7000交换机256个10GE口的大规模性能测试。详细信息见:http://edge.networkworld.com/reviews/2008/090108-test-cisco-switch-how.html?page=2和http://www.10gea.org/largest-10-gigabit-ethernet-test-in-the-industry-by-spirent.htm。

3 数据中心以太网和Fibre Channel over Ethernet

传统的Fibre Channel技术以其高速、高效、可靠和长距离传输,广泛应用在存储网络(SANs)中。但是以太网技术以其低成本、高技术、高普及率,在网络领域占据统治地位。这导致了在一个企业或者组织的数据中心网络中可能会建立若干套网络,其中以太网承载IP流量,Fibre Channel承载基于SCSI技术,可能还会由InfiniBand来承载高速集群I/O。这样就造成了大量的线缆、能耗和费用。在全球经济危机的形势下,把这些网络融合到以太网上,建设统一融合的数据中心以太网(Data Center Ethernet,DCE),能够大幅减少线缆和能耗,大大降低运维成本,是数据中心网络的发展趋势。数据中心以太网也称为融合增强型以太网(Converged Enhanced Ethernet,CEE)。

3.1 数据中心以太网(DCE)测试

在DCE/CEE中,Fibre Channel帧将映射到以太网上来进行承载。传统的Fibre Channel提供流控机制,保证无丢包,并且传统的Fibre Channel对于时延的增加/变化或者抖动非常敏感。而传统的以太网络可以容忍一定的丢包和时延变化/抖动。所以,IEEE定义了一系列标准,规范DCE/CEE对于传统以太网增强,主要包括:

●802.1Qbb Priority Flow Control(PFC):传统的以太网是整条链路进行流控的。802.1Qbb是基于优先级的流控标准。在一条物理链路上,分成了8个虚拟通道,每一个通道分配一个优先级。这样在一条链路上可以承载多种业务类型,包括FCoE和非FCoE的业务。当发生拥塞时,接收端可以在特定的优先级虚拟通道上发送XOFF和XON帧,抑制或者继续特定的业务,保证高优先级或者时延敏感的业务的传输。图3是802.1qbb的原理图。

图3 802.1qbb的原理图

●802.1Qaz Enhanced Transmision Selection(ETS):保证不同服务级别上的多种流量类型的质量。在DCE/CEE上的业务中,IPC是时延敏感的业务,SAN业务是对丢包敏感的业务,而IP业务是可以允许一定的丢包和时延。链路上的业务可以分为若干个优先级组(Priority Group,PG),并且定义每个PG的带宽属性。重要的业务,比如存储网络数据被赋予高优先级,保证带宽。低优先级业务只能在高优先级业务带宽不占用的情况下,才能使用分配带宽之外的额外带宽。图4是ETS和PG的典型例子。

图4 ETS和PG实例

作者:赵隽琪 思博伦通信 来源:电信网技术


微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“YD5GAI”免费领取《中国移动:5G网络AI应用典型场景技术解决方案白皮书
  • 2、回复“5G6G”免费领取《5G_6G毫米波测试技术白皮书-2022_03-21
  • 3、回复“YD6G”免费领取《中国移动:6G至简无线接入网白皮书
  • 4、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 5、回复“ZGDX”免费领取《中国电信5GNTN技术白皮书
  • 6、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 7、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 8、回复“5GX3”免费领取《R1623501-g605G的系统架构1
  • 本周热点本月热点

     

      最热通信招聘

    业界最新资讯


      最新招聘信息

    最新技术文章

    最新论坛贴子