在传统的数据采集系统中,a /d的控制和数据的转存均通过cpu或者mcu来完成。在这种方式下,将a /d转换的结果读入,然后再转存到片外的存储器中,这一过程至少需要4个机器周期。即使对于arm芯核的单片机(cpu采用流水线结构, 1个机器周期占1个clk) ,使用33 mhz的晶振,它的最高转存数据速度也只达到8mbit/ s. 在高速采样系统中,这种方式一方面占用太多cpu资源,另外也远远不能满足高速采样的速度要求。同时,在数据采集系统的前端数字信号处理(dsp)中,如fft、f ir、iir滤波等,以往一般都是利用dsp内部的硬件乘法器加软件控制来实现。dsp 的工作方式是通过内部的cpu 逐条执行软件指令来完成各种运算和逻辑功能的,在排队式串行指令执行方式下,工作速度和效率也将降低。为了提高数字信号处理速度,现在一些实现专用算法的dsp模块和通信接口也由fpga 或者cpld 实现。基于上述原因,设计了以virtex - 5系列的xc5vlx50为核心处理芯片的多路数据采集系统,它以硬件电路方式来提高速度[ 1 ]。
1 高速数据采集系统设计
1.1 高速数据采集系统的基本电路结构
系统中,通过多路数据选择器选定多路信号中的一路进行采集,在高速状态机控制下,将采集到的模拟信号经过多片a /d器件流水转换之后,转换结果直接储存到fpga xc5vlx50tffg1136内部由block ram构建的高速缓冲ram阵列中,然后转存至低速存储器( flashmemory)中,再由fpga构成的专用数字信号处理单元进行数据处理。在嵌入式硬核cpu power pc405的控制下又可以将flash memory中的数据送入pci总线设备或者硬盘中长期存储,同时也可以将采样结果在lcd上显示。该系统的结构框图如图1 所示。虚线内部的功能都是通过对fpga芯片xc5vlx50tffg1136硬件编程实现。
1.2 fpga芯片xc5vlx50
xc5vlx50内部有丰富的资源,包括8个数字时钟管理器(dcm, 290 kbits的分布ram, 88 ×16kbyte 的block ram, 88个18 ×18 的专用乘法器(dedicatedmultip liers)单元, 2个pow2erpc405内核, 564个可配置i/o 引脚达(最多276 对差分i/o,
速度高达31125 gbit / s,最高内部工作频率540 mhz. power2pc405内核通过xilinx提供的ip软核编程实现,文中使用了内
部一个power pc 405作为主控制器,用来完成高分辨率的液晶显示器的控制和一些外围设备和整个系统的协调性控制[ 2 ]。
2 流水采样实现
采用高带宽( 1 ghz) 高速( 80 mhz) 低功耗a /d 芯片ad9432 (12bit)作为a /d转换器件,采样时钟由xc5vlx50内部的锁相环实现。ad9432是一种单流水线adc,它采用多个低精度闪电式adc对采样信号进行分级量化,然后将各级的量化结果组合起来以构成一个高精度的量化输出。各级电路分别有自己的跟踪保持电路,因此当每级电路把信号传给下级电路时就可以接收上级传过来的数据,每级电路一次采样可在一个时钟周期内完成,但是存在流水线延迟的问题,ad9432采样转换过程如图2所示。
每次采样的最终转换结果要等待6~7个时钟周期后才能出现在输出端。ad9432的控制以及数据的缓冲转存采用状态机控制,当ad9 4 3 2接收到clk信号后开始采样。由于每块a /d 的最高采样率仅有80mhz,在此采用了4块ad9432进行
流水采样,每块a /d的采样时钟相位延迟90°,这样在每个周期内是由4 块a /d均匀采样的,采样率等效提高了4倍。4块ad9432采样时钟的相位延迟利用fpga设计的高速状态机以及内部数字时钟管理器(dcm)来实现。采用4片a /d相位延
迟并行流水采集的过程如图3所示,图中clk1~4是4片a /d的采样时钟,在这种流水采集中,单流水线延迟的影响可以忽
略[ 3 ]。
3 数据的转存设计和分析验证
采集到的信号经过a /d器件转换之后,通过xc5vlx50内部高速缓冲,转存到片外存储器flash memory中。系统中
xc5vlx50内部block ram阵列的控制比较简单,采用乒乓操作大大降低了采样数据读取处理速度。16块block ram分成
2组,时钟和控制信号均独立。系统工作时,高速状态机会不断地往block ram中放入采集到的数据。当采样数据放满1组
的8块block ram后自动切换到另外一组。同时并行从刚刚放满的8 块block ram 中以64 位的并行数据读入flash
memory中( flash memory内存具有可靠性高、互换性好、容量大等特点) [ 4 ]。
采用流水方式的4片12位的a /d的采样频率为320mhz,则数据流为480 mbit/ s,但是flash memory的最大存储速度为20mbit/ s(忽略编程时间). 为了实现数据的实时存储,采用面积换取速度的原理,充分利用xc5vlx50的内部逻辑资源和丰富的i/o口资源,设计了2个存储器阵列,每个存储器阵列由24 片flash memory,在xc5vlx50 内部进行乒乓操作,把480mbit / s的数据量分流成20mbit/ s,分别存储到24片flash memory中,当flashmemory达到编程时间的时候转向第二个存储阵列,这样的外部乒乓操作就达到了flashmemory的最高存储效率,实现了数据的高速实时采集和存储, 2个存储阵列共享控制总线和数据总线,但是使能总线独立;在一个存储阵列内部,存储芯片控制总线共享,数据总线独立,这样能达到紧密协作和节省fpga逻辑资源和i/o口资源的效果。而设计的flash memory 控制器的速度达480mhz,数据带宽符合转存需要的速度,完全可以实现实时连续采样。数据采集结束后,dsp模块会在power pc405的控制下对flash memory内存中的数据进行高速处理,然后又放回flash memory中,处理后的数据也能通过pci总线传到带有pci接口的设备中,或者通过usb总线存储到硬盘中,对pci和硬盘操作均支持dma66操作[ 5 ] 。
系统的power pc405采用xilinx的ip core实现。flashmemory controller、pci controller及usb controller等功能电
路则是根据相应的数据传输协议自行设计,采用vhdl 编程实现,使用modelsim进行功能仿真, synp lify进行逻辑综合,将综合结果下载到xc5vlx50 器件中实现相应的系统逻辑功能。
在完成电路的软件与硬件系统设计以后,用agilent16900logic analysis和高速示波器对该电路进行测试验证。16900
la的多通道眼图的扫描可以迅速发现flash memory总线中一些处于比较危险状态的信号线,比如由于阻抗的不匹配而造成signal integrity方面的问题。而la可以验证电路时序是否正确。用示波器可以正确地量测到实际信号的波形,并进行眼图的精确扫描。用16900 logic analysis测量了flashmem2ory控制电路的部分时序,结果表明flash memory总线逻辑功能正确,符合flash memory总线规范标准。对于pci controller、ide controller、dma controller均采用了相同方式进行量测验证,结果均符合其协议规范标准,可以正常稳定地工作。
4 结束语
介绍了一种基于fpga控制的,进行多片a /d器件流水采集的高速数据采集系统设计,对流水采样的原理和实现、采集
中的数据转存控制电路和flashmemory控制电路的设计进行了重点分析。在完成电路的软件与硬件系统设计以后,用agilent 16900 logic analysis和高速示波器进行测试验证。结果表明该系统可以可靠稳定地工作,最高实时采集采样频率可以达到480mhz. 并应用到了雷达信号高速数据采集器中,在多次的实际应用中表现稳定、可靠。
智库Reform表示英国政府可以通过区块链技术来对公民进行身份管理
MEN文件无法创建,MicroBlaze MCS仿真失败,究竟怎么办?
广州南沙5G+智能电网再次取得新进展
华为推出有源无源集成64T BladeAAU Pro产品 帮助运营商简化5G部署
东芝EXCERIAPROSD评测 达到了目前主流高清视频拍摄存储卡的水平
关于基于FPGA的高速实时数据采集存储系统的介绍和分析
即将推出!小米MIX4和小米Note11均将搭载MIUI13
聚焦五大应用,第五届中国芯应用创新设计大赛今日启动
低功耗PMIC趋成熟 能源采集应用热度升温
专注与创新!安田汽车电子胶粘剂应用探索系列之二
人工智能在近十年内会如何发展
GlobalFoundries在美起诉台积电专利芯片技术侵权
“机器换人”浪潮持续 未来50年内将包揽高危工作
今年是值得换机5G的年份吗?
日韩半导体产业震动
电力系统无功补偿方式及存在的一些问题
一篇包罗万象的场景文本检测算法综述
运营商对于5G小站的需求量将是4G时代的数倍
Verilog HDL verilog hdl和vhdl的区别
德国5G招标在即 华为再次陷入险境