AI编译器的逐底竞争

创造智能需要大量数据。所有这些数据都需要能够支持它的技术。
就人工智能 (ai) 而言,这些技术包括大量直接访问的高速内存;能够同时处理同一数据集的不同部分的并行计算架构;并且有点令人惊讶的是,与许多其他应用程序相比,计算精度更低。数据中心可以提供几乎无穷无尽的这种技术组合。
因此,人工智能开发工具是为互联网查询、语音搜索和在线面部识别等应用程序背后的数据中心基础设施而设计的。但随着人工智能技术的进步,在各种用例中利用它的愿望也在增加——包括那些在小型、资源受限、基于 mcu 的边缘平台上运行的用例。因此,例如,编译器等工具还必须能够针对占用空间更小的设备优化 ai 数据和算法,而不是仅仅关注运行基于云的推荐系统的高端硬件加速器。
facebook 的开源机器学习编译器 glow 就是这种工具演变的一个例子。它使用两阶段中间表示 (ir) “降低”神经网络图,该中间表示生成针对各种嵌入式和服务器级硬件目标的特性和内存进行专门调整的机器代码(图 1)。它还执行提前 (aot) 编译,最大限度地减少运行时开销,以节省磁盘空间、内存、启动时间等。
图 1. glow 高级中间表示中的降低计算图表示 a 的回归,该回归由 glow 自动区分。
“我们拥有这个非常高性能的运行时,但很多项目并不关心,因为它们不在数据中心内,”facebook 的研究科学家 jordan fix 解释道。“他们需要做 aot 编译,尽可能地缩小,使用量化和并行化,并且没有太多的依赖关系。
“aot 编译在数据中心并不那么重要,但我们可以将 llvm 后端连接到 glow 并针对 x86、arm、risc-v 和专用架构,”fix 继续说道。“glow 的工作方式是你有几个级别的 ir,它们使用高级优化和量化来限制内存。那时,编译器后端可以接受基于指令的 ir,并根据需要对其进行优化和编译。”
glow 的另一大优势,特别是在多样化的嵌入式技术领域,是能够在简单的 c 包装器中编译模型。这意味着嵌入式 ai 工程师可以针对他们选择的编译器后端和架构优化 glow。它本机支持来自流行 ai 框架和库(如 pytorch 和 arm 的 cmsis-nn)的输入,还可以通过 onnx 神经网络交换接受来自 tensorflow 等环境的图形。
ai 编译器的竞争
当然,glow 并不是唯一可用的神经网络编译器。google 的多级中间表示 (mlir) 是一种编译器基础架构,专注于张量处理器,已被 llvm 吸收。microsoft 的嵌入式学习库 (ell) 是另一个用于资源受限的 ai 设备的交叉编译工具链。
然而,glow 比任何一个都更成熟,已于 2018 年开源。它也比许多现有的 ai 编译器选项更高效。
在 i.mx 跨界 mcu 的性能测试中,恩智浦系统工程师使用 tensorflow lite 和 glow 编译了 32 x 32 cifar-10 数据集,并将它们输入 rt1060、rt1170 和 rt685 设备。glow 编译的输入表现出至少 3 倍帧/秒的性能提升,而图 2 让您了解 aot 编译与 tensorflow/tensorflow lite 框架中使用的即时 (jit) 编译相比的效率如何。
图 2a 和 2b。与 tensorflow lite 等即时 (jit) 编译器相比,glow 的提前 (aot) 编译器可节省大量 ram 和闪存,同时还具有显着的每秒帧数性能优势。
请记住,i.mx1060 具有高达 1 mb 的片上 ram。nxp 的 eiq 软件开发环境支持 glow。
开源人工智能:看不到终点线
人工智能技术市场瞬息万变,这使得开发组织很难致力于任何技术。这可能是 glow 最引人注目的方面之一,它甚至与技术没有直接关系。
作为一个拥有 130 多个活跃贡献者的开源项目,facebook、英特尔等大型组织继续对 glow 主线做出承诺,因为它们现在依赖于其通用基础设施来访问指令、操作符、内核等。
然后,很明显,开源具有内在价值。
“我们经常看到我们关心的外部用户的贡献,比如更通用的并行化框架,我们有很多他们正在运行的机器学习模型,”fix 说。“所以也许它可以让他们在我们无需做任何事情的情况下获得对运营商的支持。“我认为您正在研究这个特定的计算机视觉模型”或者,“我认为这是您所说的操作员。” 他们只是审查它并移植它并登陆它。
“我们都可以从彼此在传统开源框架中的工作中受益,”他补充道。


VISYON推出全新VR视频点播平台,兼容大多数VR头盔
基于声表面波的无线无源温度传感器为此提供了良好的解决方案
美国打华为就像狗追车,中美“科技冷战”
基于微处理器实现一对异步串口连接的接口设计
IDEA 30个天花板技巧
AI编译器的逐底竞争
S7-1500 DB数据块的类型和使用方法1
博世宣布适用于飞行出租车的新传感器平台
机器人在工业4.0中扮演什么角色
OmniVision推出采用业界最小的分割像素技术的汽车图像传感器
AR行业风雨凋零,苹果能否撑住这个行业
伺服电机的优点有哪些
与Arm合作,恩智浦在机器学习行业中占据一席之地
一文弄懂工控机是什么
打造供应链科技平台,阳光睿玺在上海开业运营
禾多科技受邀亮相GTM2022全球科技出行峰会,摘得2项年度大奖
台湾鸿海进军锂电池市场
LG或将推出双屏新旗舰V60ThinQ 后置至少三枚摄像头
华为荣耀9国内外的价格对比,华为荣耀9国内外价格相差1500,华为做的漂亮!
东芝半导体收购案背后最担心的是反垄断