虽然无线通信技术一直都在不断发展,但当前却处于一个前所未有的变革期,新兴的4G空中接口如WiMAX、LTE、UMB、802.20、WiBRO以及下一代PHS等等都有一个共同的特点:即都是基于正交频分多址接入(OFDMA)、都采用MIMO(多入多出)技术、都具有“扁平化架构”且均基于IP(互联网协议)。
本文将主要关注软件定义下(灵活)的OFDMA和MIMO架构,简要讨论在WiMAX和LTE中使用MIMO(全IP虽然也受到关注,但不在本文讨论范围),然后介绍如何实现OFDMA核心DSP算法及LTE上行链路使用的新型变量。
MIMO可以使用几种不同的形式,以WiMAX下行链路为例,有两种标准的MIMO模式:Matrix A或者STC(空时编码),以及Matrix B。STC用两种不同的形式在两个传送天线上传送相同的信号,因此数据率和SISO相比没有增加,但因为两种形式(s和–s*)是不同的,接收器有更大机会恢复数据,这样对于给定的数据率它提高了稳定性和范围。如果在下行链路也采用这种技术,则符号率数据块不会受到影响(发送的一个符号),不过现在有两个脉冲链馈送至两个天线,同时信息采用不同形式的调制方式。
Matrix B则相反,它传送两个不同的符号从而使数据率加倍。这里有两个脉冲链(对于两个天线),每个实际上都运行单独的符号而不是复制,符号率部分可以设计更为快速,然后将输出交替送到两个TX部分。在实际中,真正的系统同时支持两种模式,并根据用户选择Matrix A或B:对状况好的用更快速度传输,而对状况不好的就用STC。
这和多核架构非常匹配,如图1所示,两个独立的脉冲链馈送到两个天线上:同一个架构应用了两次,对于工程师非常简单。这一框图实际上会有些复杂,现实中很多系统将MIMO与空间技术如波束成形、“调零控制”或者SDMA结合在一起。该设计有8个天线,每个MIMO通路配置了4个,每个都有独立的操控权。
2x2 MIMO结构用于8天线下行链路
图1:MIMO下行链路系统,显示两个独立的脉冲链。该系统还包括波束成形,用于总共8个天线。
在接收器端,信号处理更加复杂,因为Matrix B的峰值数据率更高,而且接收器要区分不同的信号也要更为复杂。
LTE-TDD是TD-SCDMA未来的演进技术,相关研究与标准化工作已在中国开始进行,LTE系统要求已由3GPP发布,主要参与机构包括中国通信标准化协会(CCSA)、大唐移动、中国移动、中兴通讯、华为以及鼎桥通信等。
LTE TDD原来有两类帧结构,第一类最初可同时用于FDD和TDD,后来变为仅用于FDD。每个无线帧长度为10毫秒,包括20个0.5毫秒时段,两个连续的时段定义为一个子帧。在TDD中,子帧用于下行链路或者上行链路传输,其中子帧0和5总是用于下行链路传输,子帧2仅适用于TDD且几乎与TD-SCDMA结构一样。每个无线帧都有两个长度各为5毫秒的半帧,每个半帧包含7个时段,编号从0到6,还有3个特殊字段,分别为DwPTS、GP和UpPTS。第二类帧结构由大唐移动提出,因为它与TD-SCDMA更加兼容,所以一些特性和所定义的物理程序仍然继续适用。
第一类帧结构——仅用于FDD:
第二类帧结构——仅用于TDD:
不过在中国移动的支持下,这两种类型在去年11月举行的3GPP RAN1会议上合并为一种结构,最终的帧结构更类似于FDD结构,如下图所示:
OFDM采用了大量空间结构紧凑的正交子载波,每个都具有传统的调制方案(如正交幅度调制,QAM)以及较低的符号率,使同样带宽下的数据率类似于传统单载波调制方案。OFDMA则有所增强,可通过分配特别的符号使多个用户共享信道。
OFDM相比于单载波方案最大的优势是可以应对多种信道状态而不需要复杂的均衡滤波器,如长距离铜线的高频衰减、多通路造成的窄带干扰和频选衰减等。由于OFDM可以看作是使用很多慢调制窄带信号而不是一个快速调制宽带信号,所以信道均衡可得以简化。较低的符号率也使得在符号之间应用防护间隔更易于承受,可以处理时间分配并消除符号间干扰(ISI)。
来自市场的压力常常使供应商在标准还处于早期版本时就推出产品,所以他们必须要能用简单的软件升级办法使产品灵活升级到最终版本,最好通过同一个可编程平台能支持不同的模式或不同的标准(例如同时支持LTE与WiMAX),以便在灵活的基于软件的引擎上高效实现面向硬件的算法。一个应用实例是高性能picoChip PC102,它将上市时间和软件开发环境的优点与算法内采用并行处理的好处结合在了一起。
目前大部分系统包括WiMAX和LTE下行链路,核心算法都是FFT(快速傅里叶变换),但是LTE上行链路需要用到(更复杂的)离散傅里叶变换(DFT)。
FFT只是离散傅里叶变换的一种有效实现方式,对于一个N点DFT,直接实现所需要的乘法与加法运算复杂度为N2数量级,而传统FFT需要的运算只有N×log2N数量级,因此它是一个非常完美的例子,显示了这种聪明的算法如何得到不可思议的效率提高。FFT的特性很多地方都有介绍,在本文网络版中也有详细描述。
picoChip PC102是一种高性能针对无线应用进行了优化的多核DSP,集成了超过300个处理器或阵列元件(AE),每个都是传统的16位哈佛结构DSP,带有本地存储器。标准(STAN2)AE包括乘法累加外围元件与特殊指令,对CDMA传播和解扩进行了优化,内存分为512字节代码和256字节数据。存储器(MEM2)AE有一个乘法单元和另外的存储器,存储器在代码和数据之间的分配是可配置的。
picoArray编程模型使其易于编译流水线结构,而这正是用于实现FFT的方法。表1给出了在PC102上实现256点FFT的性能概要,表中显示256点FFT所需要的资源其采样率复杂度在10MSa/s和80MSa/s之间,同时表中给出了在每个采样率上PC102可以执行的FFT最大数。表中显示,一个10MSa/s的FFT需要约1.5%的资源。
复合采样率
每个FFT所需要的阵列元件数量(总数百分比) AE类型 最大FFT数(AE总数百分比)
复合采样率
|
每个FFT所需要的阵列元件数量(总数百分比) | AE类型 | 最大FFT数(AE总数百分比) |
10 | 5 (1.5%) | 2 MEM 3 STAN |
34 (55%) |
20 | 11 (3.6%) | 3 MEM 8 STAN |
22 (79%) |
40 | 19 (6.2%) | 4 MEM 15 STAN |
13 (80.2%) |
80 | 48 (15.6%) | 20 MEM 24 STAN 4 ANY |
3 (47%) |
表1:在picoArray上进行OFDMA 256点16+j16 FFT所用到的资源。
最大FFT数取决于可用的MEM类AE数量。
图2b显示了如何将“构件模块”FFT组合起来以得到更高输出率,显然并行结构非常适合于做这样的事。
与使用OFDM(WiFi、16d、Flash OFDM)或OFDMA(WiMAX 16e)的标准相反,LTE所选择的上行传输方案是一个新变量:SC-FDMA(单载波FDMA),也称为DFT-扩展OFDM。它相比于传统OFDMA的优点是信号具有较低的峰值-均值功耗比(PAPR),原因是其本身的单载波结构。在上行链路这点特别重要,此时较低的PAPR可在传输功效方面极大提高移动终端的性能,因此可延长电池使用寿命。正因为此,一些人称之为“鱼和熊掌兼得”:即有单载波的低PAPR,又有多载波的可靠性,虽然代价是数字处理复杂度增加。
图3是SC-FDMA上行链路实现示意图,DFT在OFDM调制器之前,它显示了与标准OFDMA相比所增加的步骤。
图3:SC-FDMA或DFT扩展OFDM。
众所周知,如果变换的规模可以分解为较少(基本)数量,DFT就可以有效执行,基本数越少,实现起来越简单,经典FFT只使用一个基本数2。
LTE里DFT预编码器的规模取决于分配给某个用户上行数据传输的子信道的数量。
其中N是子载波的数量,当N<=1,320的时候(20MHz带宽)a、b、c都>=0。对于给定用户,N可以从12个符号(a,b,c = 0 = 1* 12,一个资源块)直到1,296个,共有35个不同的选择,这些符号然后一起调制形成单载波上行链路。不过这只是发生在手机发射器端,而基站接收器要面对多个用户,每一个都从这些选择中选取,因此所有可能的帧配置能够达到的排列总数为531,783,569个,这一灵活性显然使接收iDFT变得更复杂。
分解iDFT的技术称为“分割控制”,基本原理和熟悉的FFT相同,但是长长的iDFT列表不能分解为一个基本因数,相反,每个可分解为三个短的iDFT,长度分别为2、3和5,这些是iDFT“引擎”。这种方法里,一些iDFT没有分解为基本因数(即4、8和9),以便将最大流水线级数量减少到3,其优点是可以减少延迟。
各级流水线都必须能够执行所有35种可能的iDFT功能,以及动态重配置功能,并避免在同一时刻不同长度iDFT流造成流水线出现问题。最简单的结构用于重新配置以及级缓冲器对A、B和C,这些都可作为执行所有6个iDFT引擎同样功能模块的实例(如果是1点iDFT则为7,也就是不改变直接通过)。更加优化的方案也承认只有一级需要执行9点引擎,另一个执行8点引擎,第三个执行4点引擎,对任何iDFT长度而言,对2、3、5引擎的需要永远不会超过9、8、4。
还有一个复杂的是LTE是一种可扩展带宽系统(简言之,就是TDD/FDD选项均为1.25MHz – 20MHz),表二列出了不同模式实现方式。灵活性是相对FFT而言的(见表一),需要注意结构在执行这些配置的时候是如何达到仍然非常有效,即使需要的资源是20MHz+20MHz FDD (最坏情况),PC102也只有约10%。
配置情况 | Max N | ANY2 | STAN2 | MEM2 |
20 MHz FDD | 1296 | 8 | 17 | 8 |
20 MHz TDD | 1296 | 8 | 17 | 8 |
15 MHz FDD | 900 | 4 | 17 | 6 |
15 MHz TDD | 900 | 4 | 17 | 6 |
10 MHz FDD | 600 | 3 | 12 | 6 |
10 MHz TDD | 600 | 3 | 12 | 6 |
5 MHz FDD | 300 | 4 | 8 | 4 |
5 MHz TDD | 300 | 4 | 8 | 4 |
3.2 MHz TDD | 192 | 5 | 8 | 3 |
3 MHz FDD | 180 | 5 | 8 | 3 |
1.6 MHz TDD | 72 | 5 | 4 | 2 |
1.4 MHz FDD | 72 | 5 | 4 | 2 |
表2:picoArray进行可扩展iDFT时所用到的资源。
MIMO在发射器和接收器端都使用多个天线以改善通信效果,也是所有4G系统都具有的特性。
它在数据传输率和连接范围方面有很大提升,不需要额外的带宽或传输功率,它还具有更高的频谱效率(每Hz带宽每秒可传输更多位数据)与连接可靠性或差异性(减少衰减)。
如果在TX端有m个天线,在RX端有n个,这就组成了一个m×n MIMO系统,通道数量就是所有组合的总数:例如2×2 MIMO有4个“通道”(1-1,1-2,2-1,2-2),其性能可能是SISO系统Shannon限制的两倍。对于4个“通道”,只有2x的信息可以传送,因为需要“解决”通道矩阵以抽取出信息。在实际中,通道并不是完全独立的(有一些相关),所以其性能会受到影响,一个看似矛盾的说法是MIMO对于效果差的通道(更多种多路情况)更有价值,因为这些通道很少关联,而在空旷的空间里4个通道都非常相似,因此优势反而不明显。
结论
空中接口正变得越来越复杂,而且依赖更为复杂的算法以优化性能、效率和范围。OFDMA基于FFT,正成为下一代无线技术的标准。但最新的技术如LTE正在寻求对此加以改进:采用更复杂的技术如SC-FDMA,同时需要灵活的DFT技术。
可以采用软件可编程结构模拟出面向硬件的折中优势和灵活性,使得系统制造商尽快进入需要这些算法的市场,如WiMAX和LTE,这样可以比竞争对手更早将产品推向市场,同时还保证在标准得到批准时能够符合标准。确实,一个合适的架构可以在一个公共平台实现全范围标准(如16d、16e和LTE,以及下一代PHS或UMB),而将这一架构进行扩展以支持MIMO相对来说将更为直接。