由于卷积码优良的性能,被广泛应用于深空通信、卫星通信和2g、3g移动通信中。卷积码有三种译码方法:门限译码、概率译码和viterbi算法,其中viterbi算法是一种基于网格图的最大似然译码算法,是卷积码的最佳译码方式,具有效率高、速度快等优点。从工程应用角度看,对viterbi译码器的性能评价指标主要有译码速度、处理时延和资源占用等。本文通过对viterbi译码算法及卷积码编码网格图特点的分析,提出一种在fpga设计中,采用全并行结构、判决信息比特与路径信息向量同步存储以及路径度量最小量化的译码器优化实现方案。测试和试验结果表明,该方案与传统的译码算法相比,具有更高的速度、更低的时延和更简单的结构。
2 卷积编码网格图特点
图1所示为卷积编码网格图结构,图中每一状态有两条输入支路和两条输出支路。
2.1 输入支路的特点
任意一个状态节点si都有两条输入支路,且这两条输入支路对应的源节点分别为:
此外,i为偶数时,两条输入支路的输入信息都为‘1’;i为奇数时,两条输入支路的输入信息都为‘0’。
2.2 输出支路的特点
任意一个状态节点si都有两条输出支路,且两条输出支路对应的目的节点分别为:
此外,目的节点是sj1的输出支路对应的输入信息都为‘0’;目的节点是sj2的输出支路对应的输入信息都为‘1’。
3 viterbi译码器的优化算法
3.1 判决信息比特与路径信息向量同步存储算法
由网格图的输入支路特点分析可知,产生任意一个状态节点si的输入条件mi是确定的,即mi=‘1’,i为偶数;mi=‘0’,i为奇数。输入条件mi表示译码器最终需要输出的比特信息。此外,译码器所要找的留选路径是不同状态的组合。对于(2,1,6)卷积码而言,具有2m=26=64(m为编码存储)个不同状态,可以用6位比特向量来表示所有的状态。将mi作为最高位加在状态向量上,用7位比特向量同时表示每一状态和对应的输入支路的译码信息,这样在译码器回溯时就可以直接输出存储向量的高位作为译码器的输出。采用这种方法大大降低了回溯路径和译码器判决的难度,由此降低了译码器结构的复杂性。
3.2 全并行结构设计
全并行结构viterbi译码器的特点是所有状态的路径度量计算或路径存储同时进行。其中,路径度量包括两条输出支路和两条输入支路的度量,路径存储包括状态向量存储和译码比特信息存储。因此,在(2,1,6)卷积码的全并行译码器的fpga设计中,一个时钟周期内需要实现2×n×2m=256次路径度量运算和2m=64次7比特向量存储操作。
全并行结构对每一个状态都具有独立的处理单元,互不影响,同时工作,比起传统的串行结构,大大提高了译码速度。并且由于在fpga中,有着海量的独立逻辑单元(lcs)和丰富的分布式存储资源(ram),全并行结构设计正好可以发挥fpga的这一优势。
3.3 路径度量的最小量化算法
随着网格图的行进,每个状态输出支路的路径度量会不断增加,度量值所需量化位宽越来越大,导致存储资源的增加。为了降低路径度量存储单元的大小,节约存储资源,设计中采用了路径度量的最小量化算法。在每次路径度量运算时,将各状态的度量值减去上一次各状态留选路径度量值的最小值。即需要保存的路径度量值只是各状态度量与最小度量的差值,从而达到减少度量值量化的位宽。
对于(2,1,m)卷积码,每次计算出的路径度量最大值与最小值之差不超过2×m,所以,路径度量的量化宽度为log2(2m)。对于(2,1,6)卷积码,存储路径度量的寄存器位宽为log2(2×6)=4。
4 fpga实现及验证
4.1 fpga实现的整体框架
采用altera公司的quartusⅱ为开发工具,以epls25的fpga为验证平台,用于设计和验证本文提出的viterbi优化译码算法,译码器整体设计框架如图2所示。译码器结构主要包括时钟单元、主控单元、全并行acs单元、回溯单元及译码输出单元。
(1)时钟单元
用于把板级时钟经过锁相环分频获得译码器所需的工作时钟。
(2)主控单元
给出各种控制信号,控制其他各单元的工作时序,保证译码器各模块协调工作。
(3)支路度量与全并行acs单元
由64个具有相同结构和功能的支路度量与全并行acs构成,用于计算和比较每条支路的度量,选出并保存度量值最小的路径供回溯单元使用,存储路径包括表示状态的6位信息向量和对应的译码信息比特mi。由于(2,1,6)卷积码的译码深度d=5(m+1)=35,为保证存储单元写操作与回溯单元读操作同步进行,将存储单元分为两个部分做流水线处理,因此存储单元大小应有2×d×(m+1)×2m=31 360 b。
(4)回溯单元
用于在译码深度到达时刻,根据各状态acs单元选出的留选路径,判断度量最小的留选路径,并从这条路径对应的状态开始向前寻找,直到找完前面所有状态,同时把从存储单元中读出的译码信息比特mi送给译码输出单元。
(5)译码输出单元
将回溯单元送出的反序译码信息按正序输出,用ram实现。即先将比特信息按顺序写入ram,待一段信息写完后再按反序读出。为了保证本段反序读操作与下一段顺序写操作同时进行,将ram分为两部分做流水线处理。每段信息流的长度为译码深度,因此流水线ram的大小为2×d=70 b。
4.2 设计验证
为了验证本文提出的viterbi优化译码算法,编写了图3所示的验证框图。包括一个信源产生模块、一个卷积码编码模块、一个伪随机序列发生模块以及误码统计模块。在编码器输出中加上伪随机序列模拟的噪声构成有扰译码输入信息,用于验证译码器的纠错性能。
通过quartusⅱ软件内嵌的signaltap及jtag下载线在epls25的fpga上的在线测试,得到时序图如图4所示。
图中,信号量ber是误码统计模块统计的误码数,在viterbi译码能力范围内,其值始终为0,这就验证了译码器的译码功能。通过测试与比较性能指标得到以下结果:
(1)译码器速度
通过在fpga开发板中的实际运行,译码器输出的比特速率可达90 mb/s。这与quartusⅱ提供的viterbi译码器ip核的parallel结构相当,而比其hybrid结构的译码速度快十几倍。
(2)译码器时延
本方案的译码器时延大小主要取决于译码深度d。(2,1,6)卷积码的译码深度为d=35,回溯单元处理时间和d相同;同时,回溯前最小度量的判断时间为(m-1),所以从译码输入到译码输出的总延时为2×d+(m-1)=75,这比起采用quartusⅱ提供的viterbi译码器ip核(延时为170)缩短了一半以上。
(3)译码器资源
quartusⅱ软件的资源分析综合报告如图5所示,主要消耗的资源为les:2 339,占整个芯片逻辑资源的9%;ram:31 430,占整个芯片ram资源的2%。因此,本方案对资源的需求是很少的。这与quartusⅱ提供的3.2版本的viterbi译码器ip核相当,而比4.2版本的viterbi节省1 000多个逻辑资源。
5 结 语
通过对viterbi译码算法及卷积码编码网格图特点的深入分析,提出一种采用全并行结构、判决信息比特与路径信息向量同步存储以及路径度量最小量化算法的译码器优化实现方案。测试和试验结果表明,在不降低译码器性能的前提下,能提高译码速度、降低译码器的资源消耗和时延、简化译码器结构。
OCT成像技术可改善青光眼的诊断和治疗
智慧路灯/智慧灯杆产值巨大,运营商如何布局智慧路杆项目
人工智能的发展会毁灭人类吗
钻孔与外型加工制程专业术语
PS5的详细规格曝光,5.5GB/s的SSD搭配AMD Zen 2架构
采用可编程逻辑器件的译码器优化实现方案
自制盆景雾化器,Ultrasonic Nebulizer
基于Au1200无线车载视频监控的设计与实现
独一无二的雷电SAN+NAS解决方案
华为推出基于ARM架构的服务器处理器鲲鹏920
并联电容补偿为什么不能限制短路电流?
传感器行业将是下一个万亿级市场
马斯克带领Neuralink成员,展示了通过两年取得的“脑机接口”领域
恒温恒湿试验箱的九个使用误区
苹果和三星长达7年的专利侵权纠纷达成和解
俄罗斯媒体统计中国手机占据了俄罗斯市场半壁江山
教您如何快速判断LED显示屏的质量好坏
VR头盔哪家强 索尼、HTC和Oculus三国演义
介绍真正的Grade 0汽车EEPROM
KUKA传送耐火黏土管工业机器人方案