基于Virtex系列FPGA的可编程嵌入式

摘要:介绍了基于virtex系列fpga和tms320c40dsp的可编程通用信号处理背板的设计和制作;并对virtex系列fpga的性能和特点进行了分析;同时还叙述了可编程通用信号处理背板的调试;最后给出了背板应用开发实例。 关键词:virtex系列 现场可编程逻辑门阵列(fpga) tms320c40数字信号处理器(dsp)
现场可编程逻辑门阵列(fpga)和高性能数字信号处理器(dsp)是高速信号处理领域两大关键器件,fpga和dsp的运算速度及并行处理效能成为制约高速信号处理应用的主要因素。fpga以其设计灵活性及硬件高密度性在高速信号处理领域显示出愈来愈重要的作用。xilinx公司最新推出的virtex系列fpga。是一种采用5层0.22μm cmos工艺的高性能、大容量现场可编程逻辑门阵列,其系统门密度高达100万门,系统性能可达200mhz,可选择配置为多种接口标准,内部含有丰富的布线资源,其selectram和blockram可灵活地配置为sram、fifo、dpram、cam等多种形式的存储单元。virtex系列fpga含有极其丰富的i/o资源,可灵活地与tms320c40dsp接口,与dsp配合可完成复杂的信号处理功能。c40dsp含有两组外部总线资源和6个高速通信口,可方便地进行多dsp扩展,以提高系统信号处理的性能。
在对virtex系列fpga进行充分理解和研究的基础上,结合对xc4000系列fpga和dsp背板开发设计经验,研制出了基于xcv200/300pqfp240和tms320c40的可编程嵌入式高速信号处理背板。背板采用了针对系统需求自行开发的xpci总线,背板可脱离实际应用系统进行独立的面向应用的设计和调试,也可按照xpci总线标准方便地嵌入到实际应用系统中,成为系统的一部分进行联合调试。
对可编程嵌入式信号处理背板进行全面综合测试的结果表明,背板性能达到了预期设计要求,工作状态稳定。我们还针对实际应用开发了一些fpga模块和dsp程序。
1 virtex系列fpga性能简介
在前几代fpga开发的基础上,virtex系列fpga结合了多种可编程系统的特征,采用了快速灵活的层次性互连布线资源和先进的处理技术,提供了高速度、大容量的逻辑解决方案,进一步缩短了数字信号处理系统的开发周期。与前几代fpga相比,virtex系列fpga的特性主要体现在以下几个方面:
(1)更高的处理速度和更高的逻辑门密度。virtex系列最大系统门数高达100万门,系统性能可达200mhz,其中比较常用的几个功能模块性能如表1所示。
表1 virtex 系列fpga几个常用功能模块的性能
功能模块 性能(virtex-6)
加法(16位) 5.0ns
加法(64位) 7.2ns
乘法(8位×8位) 5.1ns
乘法(16位×16位) 6.0ns
地址译码(16位) 4.4ns
地址译码(64位) 6.4ns
16选1 5.4ns
奇偶校验(18位) 5.0ns
lvttl接口 200mhz
hstl接口 180mhz
(2)更多可兼容的i/o接口标准。virtex系列可兼容16种高性能接口标准,可直接与zbtram器件接口,且其独特的i/o分组方式可使多种不同电压标准接口在同一片fpga上实现。
(3)片内时钟管理电路。virtex系列内部包含4个灵活的延时锁相环用于高级时钟管理,可实现倍频、分频、锁相等功能,此外还有4个主全局时钟网络和24个从本地时钟网络,以实现高速时钟的传输。
(4)层次性存储管理系统。virtex系列内部查找单元可配置为16bit和32bitram、16bitdpram或16bit移位寄存器,其blockram资源可配置为4kbitdpram或fifo、cam等存储器件,且提供了高速外部ram接口。
(5)更加灵活的系统结构。复杂的进位逻辑链提高了算术逻辑性能,复杂的乘法器支持,级联链支持宽位输入模块,丰富的带时钟使能的寄存器和锁存器,支持异步和同步复位及置位,支持ieee1149.1边界扫描逻辑。
(6)基于sram的在系统可重构技术。可无限次重复编程,包含主串、从串、selectram和jtag四种配置模式,支持部分重构。
2 基于virtex系列fpga的可编程嵌入式信号处理背板的设计
由于对virtex系列fpga进行了充分理解和熟悉,我们研制了基于自行开发的xpci总线的可编程嵌入式信号处理背板。由于virtex系列fpga内部结构相同,外部引脚兼容,只是在系统门数上有所区别,我们采用了xcv200pq240-4作为可编程嵌入式信号处理背板的主处理芯片,与fpga接口的dsp采用功能强大、接口灵活的tms320c40dsp。背板中dsp的应用目的是对fpga进行管理和控制、对fpga处理结果进行分析、通过dsp软件实现其他相关功能,以提高系统设计的灵活性。c40dsp具有两组外部总线资源和6个高速通信口,能方便灵活地实现系统扩展。背板中fpga可根据设计需要选择不同规模的芯片。
可编程嵌入式信号处理背板结构如图1所示。背板上主要包含1片xcv200pq240fpga、1片tms320c40dsp、1片xc9536cpld、1片edi8l512sram(512k×32bit)、1片at49020flash?2mbit?、dsp调试jtag接口、fpga调试x_checker接口、cpld调试jtag接口、自行开发xpci接口及5个独立dsp通信口。背板所有器件除dsp外均采用贴片封装、双面装焊,使得背板的尺寸较小(76mm×127mm×12mm),dsp外围512k×32bitsram使得背板系统能够满足大部分应用程序的要求。2mbitflash用于固化fpga配置和dsp应用程序代码。背板系统既可以独立工作(standalone方式),也可以通过xpci总线嵌入系统工作(plug_in方式)。
背板系统以40mhz晶振输出作为时钟,c40dsp工作在40mhz时钟下,xcv200fpga以40mhz时钟作为输入,在内部通过ddl电路可将内部工作时钟倍频到180mhz。dsp通过本地总线(la?0..30?、ld?0..31?)以ttl兼容方式与fpga接口,占用fpga 65bit i/o资源;dsp通过本地总线对fpga进行配置、参数设置及数据交换,实现软硬件之间的协同处理。
virtex系列fpga内部供电电压为2.5v,i/o通过vcco和vref控制实现与各种电平接口之间的兼容;与ttl兼容的vcco控制电压为3.3v,vref作为一般i/o使用;virtex的i/o分组方式实现使得不同电平接口得以在同一芯片设计中共存。
背板通过168线xpci总线与外部系统接口,xpci总线主要包含三大部分:电源接口、fpga的可编程i/o口、dsp接口。电源接口包括给dsp、clpd、sram及其他ttl逻辑供电的5v电源,给xcv200pq240等virtex系列fpga内部工作逻辑供电的2.5v电源,i/o接口供电电平vcco和分组参考电平vref(bank0~bank7fpga可编程i/o接口主要提供了64个从virtex系列fpga引出的可编程i/o引脚,用于设计特定逻辑;dsp接口提供了tms320c40dsp主总线接口、中断口和通信端口0及tclk0和tclk1,用于系统扩展及与用户程序之间的数据交换。
背板有丰富的配置及调试接口。virtex系列fpga在板上可实现三种配置方式:从串方式(通过xlinx专用x_checker接口)、jtag方式(通过xpci接口提供给用户)、select_ram方式(通过dsp和xc9536cpld实现);dsp调试通过专用14芯jtag接口完成;cpld逻辑可通过标准jtag电缆实时修改配置。dsp其他5个通信口通过5个idc14插座输出,可根据系统实际需要选用。
3 基于virtex系列fpga的可编程嵌入式信号处理背板的调试
在信号处理背板制作完成之后,我们对背板进行了调试,并开发了一些背板专用配置程序。
在调试过程中我们使用了whitemount公司的codecomposerdsp开发调试软件和xilinx公司的foundation2.1ifpga&cpld开发调试软件。为全面验证我们预期的设计效果,调试按以下过程进行:
(1)利用foundation2.1i通过x_checker接口向fpga下载测试配置,fpga响应结果正确。
(2)利用codecomposer通过jtag电缆对dsp内部ram和外部sram进行测试,测试表明硬件设计正确。
(3)利用foundation2.1i通过标准jtag电缆对xc9536下载测试配置,cpld响应结果正确。
(4)利用foundation2.1i通过标准jtag电缆对xc9536下载自行设计的fpga专用配置,利用codecomposer通过jtag电缆对dsp加载专用配置程序,使得dsp完成对flash烧录fpga配置数据和dsp的bootloader数据。
(5)脱离开发系统,背板上电通过flash内的配置数据自行fpga配置和dsp的bootloader?运行结果正确。
4 应用设计实例
为进一步验证背板的通用性,我们根据实际课题需求,在背板上开发了两个应用设计实例。一个是320mhz32bit高速计数器。我们在以前开发的200mhz高速计数器的基础上,基于多路均匀相差时钟信号在toa时刻进行逻辑译码获得高速计数效果的原理,通过外部40mhz输入时钟,利用virtexfpga内部ddl电路产生4路相差90°的80mhz信号,形成320mhz32bit高速计数器,使得时间测量精度达到3ns左右。该设计可用于高精度toa、pw、rf等参数的测量。
另一个是基于内容可寻址存储器(cam)的关联比较器。我们在充分分析xlinx提供的cam_core设计的基础上,自行设计了一种基于cam的可编程关联比较器。该比较器采用中值比较法,可通过控制线控制比较范围,并设计了一种专门对付捷变参数的多值比较逻辑。我们利用xcv200pq240实现了上述设计,通过测试母板上的uart从控制台微机上接收模拟辐射源数据。测试结果表明,在辐射源参数空间重叠不太严重的情况下,该设计可同时处理80个以上的装定辐射源参数(128bitpdw可包含捷变参数),且能达到较好的分选效果,可见它在侦察信号处理领域的应用前景是非常广阔的。

功率电感器商品被用于搭载电源电路各种用途
自主作战的新型无人机正式与我们见面
60W隔离反激开关电源(SMPS)电路图详解
乐淘网正式宣布第三轮融资2亿元已经全部到账
Python 如何判断字符串是否包含子串
基于Virtex系列FPGA的可编程嵌入式
高速公路组合式电子收费系统解决方案
高通、Nvidia引爆移动处理器之战
HTC与苹果停战?王雪红库克将首度会面
足球上的物联网是怎样的
高通确认已获得向华为供应4G芯片的许可证
格芯4.3亿美元出售纽约300mm晶圆工厂
谷歌系无人驾驶汽车公司Waymo于上海注册
“北斗+电网”两大国之重器,如何融合促进百姓生活变化?
真菌毒素快速定量检测系统的效果如何
全球半导体产能创新高,中国占近半壁江山
核心组件原理——pod核心原理
汽车HDI PCB的材料要求
IBM:专注于发展开放式混合云平台和人工智能,积极推动增长
模拟电子技术在电力配电系统中的应用