ai ( 人工智能)现在完全处于图像识别市场的主导地位,因为卷积神经网络 (cnn) 的表现不仅远远超越同类竞争机器实现方案,甚至让人类的图像识别能力也相形见绌。基本的 cnn 算法需要大量的计算和数据重复使用,这正是 fpga 实现方案的优势。
赛灵思 cto 办公室的杰出工程师ralph wittig在 2016 年 openpower 峰会上做了 20 分钟的演讲,讨论了 cnn 的当前技术最新发展水平以及包括清华大学等在内各个大学的一些研究结果。
这为我们带来了几个与 cnn 算法实现方案功耗相关且备受关注的结论:
继续使用片上存储器;
使用较小的乘法器;
继续使用定点算法 — 16 位定点解析可最大限度减少与 32 位定浮点计算有关的精确度退化问题,而且如果逐层使用动态量化,8 位计算也能产生良好的结果。
详细内容请观看 ralph wittig在 openpower 峰会上的演讲视频:
在本视频中,wittig 还说明了两款 cnn 相关产品的使用情况。 这两款产品此前在xcell daily中有报道:
与 capi 兼容的 alpha data adm-pcie-8k5 pcie 加速板。(请参见:alpha data 面向 x86 和 ibm power8/9 数据中心及云服务器的 adm-pcie-8k5 pcie 加速板使用 kintex ultrascale fpga。)
auviz systems 的 auvizdnn(深度神经网络)库。(请参见:深入了解 auvizsystems 的卷积神经网络性能加速、云端的机器学习:fpga 上的深度神经网络以及 auviz 图像处理及计算机视觉库与赛灵思 sdaccel 相配合,可为 fpga 实现堪比 gpu 的性能。)
扩展阅读:
xilinx 与 ibm 携手通过 supervessel 云实现 fpga 加速
xilinx 拓展生态系统和平台强化嵌入式视觉和工业物联网产品组合
面向数据中心与云服务器的 pcie 加速卡来了!
future is here!
TD-SCDMA测试解决方案及应用研究
Exar公司发布下一代压缩和安全协处理器
iphone8什么时候上市:iPhone8最低容量64G起,苹果十周年独宠iphone8!
西门子PLC S7-1500系列与西门子变频器G120之间实现DP通讯功能
TIOBE已公布2020年9月的编程语言排行榜
关于CNN的当前技术最新发展水平以及包括清华大学等在内的研究结果
中国芯之路:满地泥泞亦要前进
海康机器人CS系列可满足3D检测应用当中多样、复杂需求
东芝推出中国数字电视规范信号接收解调器IC
爱芯科技完成新一轮品牌升级 比亚迪获“2021年深圳市质量创新奖”
光纤收发器常见故障及解决方法的介绍
美国公司申请向华为出口产品的许可请求将不太可能获得批准
GaN技术的电源是如何开发的
微软的Xbox Elite无线控制器可能正在跟进
EMC滤波器的工作原理 EMC滤波器优化技巧分享
磁盘阵列技术原理学习
AMS与欧司朗的业务合并协议谈判取得了进展
揭秘魅族负资产的背后,阿里既然占有将近30%的股份
拦住对手:新款Blackfin处理器树立高性价比新标杆
印度拟限制中国手机价格?中方回应