摘 要: 目前星载信号处理平台中大量使用商用芯片,但商用芯片抗辐射能力较弱,在空间环境下常出现单粒子翻转(single event upset,seu),从而造成系统功能紊乱,甚至中断。提出以星载信号处理平台中大量使用的sram型fpga为研究对象,采用故障注入的方式研究fpga中不同硬件资源对于seu效应的敏感性问题。根据不同资源对seu效应表现出不同敏感性的结论,可在sram型fpga的抗seu防护上进行有针对性的设计。
0 引言
随着星载信号处理平台对于信号处理能力需求的不断提升,宇航级芯片已越来越难以满足需求,而商用芯片相对宇航级芯片拥有更强的处理能力和更多的处理资源。所以基于商用芯片构建星载处理平台的商用现成技术(commercial off-the-shelf,cots)成为当前卫星通信平台设计领域的研究热点。
由于商用芯片向着高密集度、低操作电压的方向迅速发展,使得它们在空间辐射环境下的可靠性大大降低。其中软故障是主要故障,它是由带电粒子和pn结相互作用引起的一种暂态故障,可造成芯片严重的运行错误[1]。所以如何弥补商用芯片本身抗辐照能力的不足是需要解决的重要问题。
国内外研究机构对于星载信号处理平台抗seu方法目前主要分为两类:一类是针对seu的屏蔽,包括各种抗seu加固结构设计、高性能抗seu的cmos(complementary metal oxide semiconductor)工艺等[2];另一类是针对seu的修复,如动态可重构技术、编码纠正[3]等方法。另外,由于星载平台中包含大量的诸如fir(finite impulse response)滤波和fft(fast fourier transform)的处理过程,故近年来针对各种滤波器和信号处理算法本身抗seu的方法研究特别广泛,如文献[4]、文献[5]分别实现fir滤波器和fft算法的容错技术。
相对于上述研究思路,本文则重点关注芯片内部各种不同硬件资源对于seu事件的敏感性。以星载平台上应用广泛的sram型fpga为研究对象,通过模拟星载平台和故障注入的实验,根据各种资源在故障源注入后诱发系统出现功能紊乱的概率总结出各种资源对于seu敏感性高低的结论。
1 seu敏感性研究模型
为验证sram型fpga不同资源对于seu存在不同的敏感性,需要模拟星载信号处理平台sram型fpga在外部空间遭遇seu效应的整个过程。即在地面上模拟采用sram型fpga的星载信号处理平台,模拟fpga出现的seu错误,以及将模拟的seu错误注入到fpga内部不同资源中。据此提出seu敏感性研究的模型,如图1所示。
根据研究模型,首先可以采用基于商用芯片的星地联合处理平台来模拟星载平台,其硬件环境如图2所示。其中cpci(compact peripheral component interconnect)总线用来模拟星地链路,星载处理板模拟星载信号处理平台,处理板采用了多片sram型fpga芯片作为实验的测试芯片。
为调用fpga内部资源,采用两种功能相同但实现方式不同的功能模块,因此可以针对两种模块设计颗粒度不同的实验a和实验b来分别进行实验。基于功能模块通过故障注入的方式生成模拟的seu错误,在系统正常运行的情况下,将错误注入到平台fpga的功能模块中,观察注入前后的输出状态,对比两次实验结果,得出seu敏感性研究的结论。
2 seu敏感性实验设计
2.1 基于ip核的fft敏感性实验设计
通常星载平台中拥有大量的fft运算,而这些运算大都通过在fpga中调用ip核来实现。因此以基于ip核的fft来进行seu敏感性实验是合理的。sram型fpga芯片由6个部分组成,其中slice资源是可编程逻辑单元的基本逻辑单元,ram资源是fpga常用的硬核模块,两种资源都是fpga内部广泛分布且应用较多的资源。所以基于ip核的fft敏感性实验所针对的资源就是slice和ram。
slice资源内部主要的配置关系是逻辑关系,即“+”、“~”、“*”关系;ram资源内部主要的配置关系是数值关系,即0、1数值关系。所以针对这两种资源的故障注入将分别围绕这两种配置关系进行修改。利用fpga_editor查看网表文件,并对其进行修改,生成差异比特文件,即模拟故障源。在fft模块正常运行后通过测试电脑经模拟星地链路,反复将故障源注入到fft模块中,通过chipscope抓取结果,根据结果得出结论。
2.2 基于软件实现的fft敏感性实验设计
为进一步验证上述结论,在前述实验的基础上,设计了另一种颗粒度更高的实验来加以证明。该实验运用vhdl语言编程实现16点的fft功能模块,该模块调用更多的fpga资源,采用相同的星地联合处理平台,同样针对slice和ram两种资源进行故障注入实验。
设16点数据为x(0)、x(1)…x(15)的16位的实数数据,按时间抽取的基2 fft算法原理可得该16点fft的蝶形交织运算,如图3所示,其结果即是x(0)~x(15)的16点fft输出。由图可知,该fft算法原理的核心是每一层的蝶形交织运算,因此整个16点fft程序设计的关键是四层的蝶形交织运算。
设计程序分成五部分,即顶层的输入输出和4个蝶形交织层。最初输入16点的16位实数数据,然后通过每层的蝶形交织计算得到最终fft的输出。将结果与matlab仿真进行对比,验证该fft模块是否编写正确。确认模块功能正确后,同样针对slice和ram进行修改;然后进行故障注入试验,通过chipscope抓取结果;最后根据结果得出结论。
3 seu敏感性实验及分析
3.1 基于ip核的fft敏感性实验及分析
通过fpga_editor可得知ip核fft模块拥有1 227个slice、17个ram资源。将1 227个slice资源中每连续的20个左右分为一组,共分为60组。对每一组资源中的每一个slice都在数量为10处进行逻辑修改。将17个ram资源划为17组,对每一个ram分别进行数量统一为10处的数值修改。最后得到60个slice和17个ram的差异比特文件,并对每一个差异比特文件进行100次的反复注入。
3.1.1 实验结果
针对slice资源的故障注入结果分为四个程度,分别如图4~图7所示。所有60组试验中只有4组结果正确,其余组都出现各种错误。
针对ram资源的故障注入结果分为三个程度,如图4、图8和图9所示。所有试验中只有4组出现错误。
3.1.2 实验结论
(1)在slice颗粒度约为20个一组、共60组的情况下,根据大量反复注入的试验结果,利用统计数据可得针对slice资源故障注入后模块的故障率为:θ1=(56/60)×100%=93.3%;针对ram资源故障注入后的故障率为:θ2=(4/7)×100%=23.5%。故在seu效应敏感度上,slice强于ram。
(2)试验中每组故障注入的数量一致,但注入的位置各不相同。通过每组最后的结果对比可知,不同位置的故障注入将对模块产生不同程度的影响。
(3)在77组故障注入试验中,结果是逻辑修改引起的模块故障率更高。故seu造成逻辑上的故障对整个模块影响要明显强于数值故障造成的影响。
3.2 基于软件实现的fft敏感性实验及分析
为了验证该编写的fft模块功能正确,首先在matlab中实现fft算法,然后将其每层蝶形交织结果与vhdl程序的每一层蝶形交织结果进行对比。对比输出结果如图10所示,左侧为matlab仿真结果,右侧为vhdl程序运行结果。
由对比可知,vhdl程序运行结果与matlab仿真吻合,证明该程序具备正确的fft功能,可作为本次实验的模块。通过fpga_editor可知,生成的fft模块拥有2 265个slice、2个ram资源。
与前述实验类似,将该fft中的2 265个slice资源每连续的10个左右分为一组,共分为240组,对每个slice进行数量为10处的故障注入;将2个ram资源划为2组,对每个ram进行数量10处的数值修改。最后生成240个slice和2个ram差异比特文件,并对每个文件进行100次的反复注入。
3.2.1 实验结果
针对slice资源试验,所有试验中有32组结果正确,其余出现明显错误,如图11所示。针对ram资源的试验结果2组都正确,如图12所示。
3.2.2 实验结论
(1)本次实验在前述实验的基础上将slice测试颗粒度提高1倍,试验组数提高4倍。由大量反复注入的试验结果,利用统计数据可得针对slice注入模块故障率为:θ1=(208/240)×100%=86.7%;针对ram资源故障注入后的fft模块故障率为:θ2=(0/2)×100%=0%。所以有θ1>θ2,故在seu效应敏感度上,slice强于ram。
(2)每组故障注入的数量相同,但位置不同。结果发现不同位置的注入对模块产生不同程度的影响。
(3)该次实验依然是针对slice资源进行逻辑修改,针对ram资源进行数值修改。从结果来看,依然是逻辑的错误对整个模块的影响强于数值错误。
4 结论
本文重点分析芯片内部不同硬件资源对于seu效应敏感性的问题。以sram型fpga为研究对象,设计进行了两种颗粒度不同的故障注入实验。结果表明,在fpga内部资源中,slice资源对于seu效应的敏感性很强,ram相对较弱。seu效应引起的逻辑错误比数值错误更能诱发系统的功能紊乱。所以,可针对fpga中占用slice资源较多的模块进行防护,重点针对逻辑错误进行防护。
华为多款机型通过了国家 3C 认证
苹果iphone8将采用曲面屏 小米芯片发布5C首先使用
C++:引用的使用场景
OLED显示屏、量子点新老显示阵营之争,谁会攻下中高端电视市场?
采用晶片尺寸型覆晶基板的IC设计业者大势增长
分析芯片内部不同硬件资源对于SEU效应敏感性的问题
RTX2060值得买吗
照明应用中LED闪烁的原因及解决方案分析
2019集微半导体峰会:蒋尚义作了《从集成电路到集成系统》的演讲
怎么在FPGA或ASIC系统中实现高效高速USB 2.0接口?
用离散变量编码的逻辑量子比特打破盈亏平衡点
网曝小米要进军医疗行业 小米官方回应就是小米园区开了个医务室
宁波市打造综合性服务平台的新型光电显示产业
直线电机的用途 直线电机和旋转电机的优缺点
港中文贾佳亚团队联手MIT发布超长文本扩展技术,打破LLM遗忘魔咒
ADI最新推出Blackfin(R)系列新成员BF50x系列
基于深度学习的透射式光学系统初始结构设计
关于GD32F350R8的摄影光源控制器的性能分析和应用
阶跃恢复二极管的工作原理
美国联邦航空管理局提出了一种超声速飞机噪声的认证标准