想成为AI独角兽?必须以FPGA为技术支点

最近想必很多人工智能(ai)界小伙伴的朋友圈,都会被一则新闻刷屏:国内ai初创公司深鉴科技被全球排名第一的fpga公司赛灵思(xilinx)收购,尽管各方都没有披露收购的财务细节,不过据称先前深鉴科技的估值就已经达到了10亿美元。
为什么这家成立刚刚两年的公司,就可以成为令人羡慕的ai独角兽?其中有很多原因,不过从技术的角度来说,很大程度上这是因为他们在创业之初做对了一件事——选择fpga作为ai梦想的支点。
支持算法迭代
大家都知道ai的abc三要素——算法(a)、大数据(b)和算力(c)。为让人工智能算法基于大数据释放出最大的能量,就必须有强大的硬件计算平台做支撑。目前我们可用的硬件平台架构主要是cpu、gpu、fpga和asic这几种。
如果单从计算性能和效率、功率和面积来看,专用的asic肯定是最佳选择。不过处于发展初期的ai,其算法总是在快速迭代和变化之中,在无法形成大规模稳定应用之前,将算法固化在asic中,而没有任何灵活性,将意味着巨大的成本和风险。
而cpu则是另一个极端——它有极强的通用性和灵活性,可编程,可以跑各种算法,但是计算的效率太低,无法满足ai大量并行计算的需要。gpu无疑是近年来ai界的明星,其凭借出众的并行处理能力,已经成为很多云端ai数据中心的计算核心,但从本质上来讲gpu硬件结构还是固定的,不具备可编程性,面对ai算法的迭代变化,还是会力不从心。
而fpga由于是一种硬件可编程的处理架构,可以随时调整硬件架构以适应算法的变化,因此可以很好地去应对ai算法多样性和快速迭代的挑战。而且目前xilinx等fpga厂商还推出了arm+fpga的异构开发平台——如zynq fpga soc——将嵌入式处理器和可编程逻辑整合在一起,开发者可以根据需要在两个系统间分配计算任务,探索出最优的解决方案,为ai提供一个兼具高性能和灵活性的计算平台。
卡位推理应用
而且随着人们对ai应用场景的深入了解,fpga的另一个优势也逐渐显露出来。ai的应用场景可以分为训练(training)和推理(inference)两个环节。训练是指利用海量数据,选择合适的训练方法,训练出一个人工智能模型,这需要庞大的计算集群,所以大多是在云端完成的。
推理是指利用训练出来的模型来在线响应用户的需求,做出决策判断,这个过程既可以在云端完成,也可能是在网络边缘端用户侧的智能设备中完成。gpu的特性决定了其更适合去做大规模的并行计算,在云端以最快速度处理海量数据训练、验证模型的有效性。
但对于推理这种通常一次只对一个输入项进行处理的应用,gpu并行计算的优势发挥不出来,因此并不适合。而fpga的架构则更适合于推理环节的计算任务,而且对于那些位于网络边缘、性能受限、功耗苛刻、要求实时性的ai应用,fpga更是能体现出它的优势。
实际上推理环节是ai的应用落地的关键,这就意味着不论云端还是边缘设备中,都要部署相应的推理计算资源,因此fpga未来在ai中的市场潜力是非常巨大的。
图1,深鉴科技基于fpga平台的dpu与gpu方案的性能对比(资料来源:36kr)
快速响应市场
fpga能给ai玩家带来的再一个好处就是,可以让他们在短时间内去验证和优化自己的算法,根据市场需要快速开发出应用方案,而同时避免投资专用asic芯片而带来的巨大成本压力。这方面,深鉴科技就是一个很好的例子。
深鉴科技的ceo姚颂在接受媒体采访时曾经坦承,选择fpga架构作为ai的切入点是他们产品规划的一个重要组成部分——用fpga实现,而不是直接做asic,可以很快做出产品,拿到客户的测试反馈后,基于fpga的可编程特性马上进行修改、烧写,再次更新给客户,用这样的方法他们才得以快速响应客户需求,抢占市场先机。
有人把深鉴科技的做法形容为利用具备可重构特性的fpga芯片来实现半定制的人工智能芯片,他们设计开发的“深度学习处理单元”(deep processing unit,dpu)芯片就是基于fpga平台,希望以asic 级别的功耗来达到优于gpu 的性能。这种半定制芯片抽象出了指令集与编译器,可以快速开发、快速迭代,与专用的fpga加速器产品相比,具有非常明显的优势。
总之,以fpga为技术支点,ai的开发者可以快速完成了软件算法开发、硬件平台搭建、产品方案开发等一系列工作,实现全面开挂……已经有成功的案例在前,你想成为ai独角兽,是不是也该和fpga交个朋友?

OpenHarmony硬件资源池化架构介绍 OpenHarmony如何实现多设备协同
2011深圳电子展:友派U8平板电脑
2019年,现代品牌有什么?2019年北京现代要做什么?
oppor11最新消息:红米Pro2配置曝光,让oppor11再次成为高价低配!
智能制造不仅仅只是大企业的专利而应该让它成为中小企业的普惠
想成为AI独角兽?必须以FPGA为技术支点
“剪刀差”效应愈发明显,制造业“机器换人”已成必然
疫情刺激下的NB-IoT有什么不一样
首尔半导体宣布对美国一公司提起专利诉讼 涉及11项LED驱动技术专利
两节锂电池充电芯片,电池管理系统
镭神智能旗下多款激光雷达产品大幅度降价,最大降幅甚至达到五成
自激多谐振荡器设计实验的实验报告
柔性时代的产物,新一代柔性协作机器人Xmate
数据标注——数字世界的基石
又一款黑马袭来,长安CS75这款SUV外观霸气不输路虎,性能出众
半导体磁敏元件简介
浅谈CAN总线在铁路通信中的应用
如何使用Phasics SID4相位成像相机进行表面测量?
ISO7816 (part 1-3)异步
智能音箱:打开智能家居的大门