基于FPGA速率匹配算法的实现

lte(长期演进)是3.9g的全球标准，采用ofdm和mimo技术作为其无线网络演进的唯一标准，极大地提高了系统的带宽[1]。而速率匹配是lte系统中重要的组成部分，因此速率匹配设计的优劣，决定整个系统性能的好坏[2]。lte系统中，速率匹配是指传输信道上的比特被打孔或者被重发，以匹配物理信道的承载能力。当输入的比特数目超过物理信道的承载能力时，就要对输入的序列进行打孔；而当输入的比特数目不满足物理信道的承载能力时，就要对输入的序列进行重发。根据编码方式的不同，速率匹配又可分为卷积编码和turbo编码的速率匹配。fpga在数字信号处理方面性能优越，利用fpga做乒乓操作能够明显地提高数据的处理速度[3]。
1 速率匹配算法 1.1 速率匹配的整体流程在lte系统中，基于turbo编码的速率匹配过程如图1所示。该过程主要包括子块交织、比特收集、比特选择和修剪[4]。
2.2 乒乓前控制模块的fpga实现数据经过turbo编码器后分3路暂存在3个ram中。当速率匹配模块中的使能信号rate_match_en拉高时，所有的模块开始工作。如果乒乓前控制模块的启动信号control_start为高电平并且接收到的码块个数是偶数，则子块交织a模块的启动信号interleavera_start拉高，此时子块交织a就会读取外部ram中的数据，进行子块交织；否则子块交织b模块的启动信号interleaverb_start拉高，子块交织b会从外部ram中读取数据，进行子块交织。从而实现了乒乓操作。
2.3 子块交织的fpga实现以子块交织a模块为例。当子块交织a的启动信号拉高时，子块交织a模块会从外部ram中读取数据。首先读取第1路数据。第1路数据读取完毕后立即读取第2路数据和第3路数据。第2路数据放在偶数位置，第3路数据放在奇数位置。在turbo编码模块中，输出的数据已经加入了填充比特。为了区别填充比特和数据信息，输入数据的位宽占2 bit，填充比特用3来表示。子块交织输出的数据仍然占2 bit的位宽，只有在比特修剪模块后，数据才按照1 bit的位宽表示。在子块交织的fpga实现过程中，将外部ram模拟成一个交织矩阵。交织矩阵的每一个元素对应ram的每一个地址，每一个元素的具体内容对应于ram的每一个数据。在程序中，第1路数据与第2路数据的交织方法一样，用变量f_matrix_column、s_matrix_column、t_matrix_column表示3个交织矩阵的列；用变量f_matrix_row、s_matrix_row、t_matrix_row表示3个交织矩阵的行。以读取第1路数据为例，因为是行写入列读出，所以行变量f_matrix_row每个时钟要自加1，直到行变量取到rtcsubblock-1时归零，同时列变量f_matrix_column按照表1所示进行列交织。
按表2进行交织以后，将ram交织矩阵中最后一列的第1个地址中的数据放到该列的最后一个地址中，将剩下的数依次向上移一个地址即可。
2.4 乒乓后控制模块的fpga实现在子块交织a和子块交织b开始工作时，乒乓后控制模块也已经开始工作。当子块交织a的启动信号interleavera_start拉高时，乒乓后控制模块会将子块交织a输入的数据传输给比特修剪模块；反之，则会将子块交织b输入的数据传输给比特修剪模块。
2.5 比特修剪模块的fpga实现在比特修剪模块中，一个码块的数据进行子块交织后会缓存在一个ram中。此方法可以阻止在输入数据少于输出数据需要重发操作时由于数据丢失而引起的传输错误。本程序中进行了乒乓操作，但由于输入数据速率小于输出数据的速率，所以乒乓操作不能做到无缝隙地进行，输入的码块之间会有一定的间隔。而为了将码块之间的间隔限制在最小范围，将表示速率匹配输出序列长度的变量e和表示取数起始位置的变量ko输出给turbo编码模块，可使码块之间的间隔限制在最小。在比特修剪时，设置一个计数器变量counter，初始值设置为零。当ram中缓存的数据大于ko时，可以从ram中读取数据，若该数据是填充比特，则跳过，计数器counter不变；否则，计数器counter自加1，同时输出数据。直到计数器counter的值等于e时，读取数据完毕。等待下一个码块子块交织后输入的数据。
3 fpga实现结果分析图3和图4分别是pusch信道子块交织的modelsim仿真图形和fpga实现图。本程序的时钟频率是200 mhz。virtex-6芯片做为测试平台。程序中dataof-interleaverb和dataofinterleaverb是pusch信道子块交织的输出数据和标志位，a_matrix_row和a_matrix_column分别表示交织矩阵的行和列， a_addrb是ram交织矩阵的地址。由于交织矩阵的列数有32个，所以每次输出数据的地址就要加32，以实现列读出。变量a_matrix_row取到矩阵的最后一行后，又重新取下一列的第一行，直到32列全部取完为止。从pusch信道交织的仿真图和fpga实现图可以看出，仿真结果与fpga实现结果一致，因此fpga能够准确地实现pusch信道的子块交织功能。
图5和图6分别是pusch信道比特修剪的modelsim仿真图形和fpga实现图。从图形中可知，仿真结果与板级验证的结果一致，fpga能够稳定、准确地实现比特修剪的功能。
子块交织和比特修剪的verilog[5]程序已经通过了xilinx ise 13.4[6]的编译、仿真、板级验证和联机测试。结果表明，运用fpga来实现速率匹配算法能够满足lte系统对速率匹配的速度要求，同时也能够充分发挥fpga并行操作的优越性。在此基础上，引用乒乓操作的方法，在不消耗更多资源的情况下，进一步缩短了速率匹配的处理时间，为整体系统的快速运行提供了基本的速度保障。由于该算法的fpga实现在联机测试中，性能稳定，故已在td_lte射频一致性项目中得到应用。
参考文献
[1] 陈发堂，李小文，王丹，等.移动通信接收机设计理论与实现[m].北京：科学出版社，2011.
[2] ma chixiang，lin ping.efficient implementation of rate matching for lte turbo codes[c].the 2nd international conference on future computer and communication(icfcc 2010)，2010：704-708.
[3] 曹华，邓彬.使用verilog实现基于fpga的sdram控制器[j].今日电子，2005，10(1)：11-14.
[4] 3gpp ts 36.212 v9.1.0.3rd generation partner-ship project；technical specification group radio access network；evolved universal terrestrial radio access(e-utra)；rate matching (release 9)[s].2010.
[5] 夏宇闻.verilog数字系统设计教程(第2版)[m].北京：北京航空航天大学出版社，2008.
[6] xilinxinc.foundation series user guide[eb/ol].(2010-01-03).

系统总线的特点_系统总线工作原理
串行外设接口(SPI)扩展大容量数据存储器
网络系统安全接入认证方法探讨
一种基于硅的热光效应与闪加热驱动的电可调超构表面
嵌入式硬件安全模块加速汽车SoC设计
基于FPGA速率匹配算法的实现
又下了一步“好棋” 中移国际法国子公司成立
浅谈边缘AI领域中的传感器面临的挑战
广西打造数字政府，提供“线上一网通、线下一门办”便民服务
需要升级树莓派的5个原因
PS-9105S小三轴荷重试验机的详情？|深圳市磐石测控仪器有限公司
高智能土壤养分快速检测仪多少钱一台的介绍
基于pipeline的文本纠错系统框架分析
爆AMD的RX 6800首发货源非常非常稀少
人工智能对传统零售行业会造成多大的冲击
百度正在加速AI的布局，从UNIT到人脸识别到图像识别
登顶！华为OceanStor Pacific存储达成IO500榜单全球第一
行星减速机是如何搭配伺服电机的？
浅谈大功率LED应用中的八大问题
国家电网总信息师孙正运：数字化转型助力能源互联网建设报告