提高FPGA处理总线性能的RapidIO节点设计

1 引言
在传统的嵌入式多处理器系统中,处理器之间的互连是通过分时共享总线来实现的,所有通信争用总线带宽,由此就造成处理器越多,每个处理器可用带宽就越少, 从而带来严重的系统信息传输能力瓶颈。并且总线具有大量的引脚数目,带来了一定的电气特性和机械特性等问题,使得信号频率以及信号可传输距离都受到很大程度的制约。
rapidio总线技术是一种基于高性能包交换的互连技术,具有极低的延迟(纳秒级)和高带宽。rapidio总线技术的提出 消除了带宽这个瓶颈问题,成功解决了处理器集成芯片之间和线路板之间互连问题。目前rapidio已经成为唯一的一个系统内串行互连协议标准,世界各大半导体公司都陆续推出了基于rapidio技术的相关产品,基于rapidio通信体系架构技术的系统已在电信、国防、医疗等行业大量使用。
当前在一个高速嵌入式多处理器系统内一般由ppc、dsp和fpga等处理器构成。本文对fpga的rapidio节点设计进行了功能测试和验证。
2 rapidio 技术概述
rapidio可提供10gbps以上的带宽(rapidio 2.0规范可提供100gbps带宽),其所有的协议都是由硬件实现的,与软件无关。适合用于芯片与芯片、板与板、系统与系统之间的高速数据传输。
rapidio 协议采用三层分级体系结构。逻辑层规范位于最高层,定义全部协议和包格式,它们为端点器件发起和完成事务提供必要的信息。传输层规范在中间层,定义 rapidio地址空间和在端点器件间传输包所需的路由信息。物理层规范在整个分级结构的底部,包括器件级接口的细节,如包传输机制、流量控制、电气特性 和低级错误管理。
rapidio的传输操作是基于请求和响应机制,传输操作可以在包传输间歇插入控制符。包(packet)是系统中端点 器件的通信单元。由发起者(intiator)产生一个传输请求,请求包被传输到相邻的交换器件,从而进入交换机构,通过交换机构这个完整的请求包被传输 到目标器件(target),目标器件根据请求完成相应的操作后,发送相应的响应包,经过交换机构传回到发起者,这时一个完整的传输过程完成。控制符一般 在物理层互连中用作传输管理,如包的确认、流控信息和维护功能等。如图1所示。
图1 rapidio的传输操作
rapidio 的三层体系结构可以将不同的单元互连起来,不同的单元之间以包的形式进行通信。这样的互连网络可以有很灵活的系统拓扑,常用的是基于交换的互连系统。一个 包从一个处理单元送到另一个处理单元是通过交换单元进行的,交换单元通过对包格式里的传输字段进行译码,而得到包所要到达哪个处理单元。由于通常一个请求 包对应一个响应包,所以包格式里的传输字段还要定义响应包的返回路径。
3 rapidio的fpga节点实现
典型的系统网络由ppc、dsp和fpga三种节点构成。随着cpu、dsp和fpga等处理器的性能得到较大提升,提高连接这些高性能器件的总线性能成为 提升系统性能的关键。在一些处理器、系统逻辑、fpga和asic中都已经实现了rapidio技术,如xilinx公司已经出售rapidio的终端接 口逻辑ip核;ti公司的dsp芯片tms320c6455内部集成了串行rapidio外设;motorola公司已经推出的 powerquicciii处理器中集成了rapidio接口逻辑;tundra公司提供8端口的串行1x/4x的 rapidio交换芯片tsi568a和rapidio桥接芯片。这里讨论fpga中rapidio节点的实现。
rapidio网络中fpga上的rapidio节点,可以采用xilinx rapidio解决方案实现。xilinx rapidio解决方案如图2所示,它由物理层核,逻辑传输层核、缓冲器核和参考设计4个部分组成。其中参考设计控制时钟、复位和配置空间的存取。
图2 serial rapidio 功能框图
逻 辑层和传输层接口如图3所示。逻辑层通过xilinx特有的本地link接口与物理层相连,以构成rapidio节点。逻辑层分为几个模块来控制发送和接 收包的串接和解析。其中用户接口(user interface)包含4个端口 (initiator request, initiator response, target request 和target response) ,从这里向remote节点发送包或接收remote节点发送的包,它是使用xilinx srio解决方案时用户通信使用的接口。还可以从这些端口发起到本节点配置寄存器的读写操作。维护接口包含
2个端口(maintenance request/response port和configuration register port),控制对逻辑层的配置寄存器以及用户定义寄存器或物理层配置寄存器的读写。
图3 逻辑层和传输层接口
4 验证设计实例
fpga 芯片选择xilinx的v5系列的芯片xc5vlx110t,它内置了16个rocketio收发器,支持从100mbps到3.75gbps串行数据传 输速率,支持目前流行的包括rapidio在内的高速串行i/o接口标准。能够在它的基础上实现rapidio高速串行数据传输系统。在程序中还通过添加 vio核以方便控制消息、门铃等的发送。试验平台构架如图4所示,在fpga中通过chipscope来观察相关信号进行验证。
图4 调试环境
通过远端ppc节点向fpga发门铃和消息,chipscope在fpga接收端口target request得到的结果如图5,图6所示,触发信号选用帧起始标记treq_sof_n。由图可见fpga的rapidio节点可以正确的接收消息和门铃。
图5 门铃试验结果
图6 消息试验结果
5 结束语
rapidio互连有效的应对了高性能嵌入式系统在可靠性和互连性方面的挑战。这里使用xilinx公司的rapidio解决方案实现了系统中fpga的rapidio节点,在新一代通信及数据网络应用中具有广泛的应用背景。

cache基本知识培训教程[2]
安森美半导体推出用于网络及通信应用的高性能时钟分配方案
2020年人工智能在云平台上的应用有什么增长
ARD3M-5/CLQ安科瑞电动机保护器 停机控制启动控制 漏电流保护
今年最后一次微软Edge浏览器更新,即将支持苹果M1 Mac
提高FPGA处理总线性能的RapidIO节点设计
装备制造业如何借助数字化破局突围
Bourns针对DSL、以太网与PoE应用推出最新G.fast及LAN变压器
“AVP-乘用车L4级别自动驾驶的必经之路” 的演讲
楼宇园区数字化管理模式的详细说明
突破软包电池成组“软肋”
你能接受苹果发布没有充电接口的iPhone吗?
比特币的价值是否存在stock-to-flow的关系
Globalfoundries对台积电诉讼最新详细进展
Kubeflow 1.0带来了稳定的内置管理控制台版本
无线技术在物流业务中的应用设计介绍
iPhone12 mini价格破发,直降500元
“中国联通云网融合研发回顾与展望”主题演讲
苹果watchOS 5发布,新增对讲机功能
IAMS推出生物识别应用,通过扫描鼻子识别走失的狗狗