启动人工智能应用从来没有像现在这样容易!受益于像xilinx zynq ultrascale+ mpsoc 这样的fpga,ai现在也可以离线使用或在边缘部署、使用。瑞苏盈科核心板模块结合vitis ai开发工具给用户提供了便利工具,可用于开发和部署用于实时推理的机器学习应用,因此将ai集成到应用中变得轻而易举。图像检测或分类、模式或语音识别推动了制造业、医疗、汽车和金融服务等产业的升级。
快速开启基于ai的fpga应用
enclustra
人工智能正在占据越来越多的应用和生活场景,例如图像检测和分类,翻译和推荐系统等等。基于机器学习技术的应用数量庞大且还在不断增长。采用瑞苏盈科结合fpga和arm处理器的核心板模块,在离线和边缘使用ai前所未有的容易。
人工智能(ai)历史悠久,自1955年便被公认为一门学科。人工智能是计算机模仿人类智能、从经验中学习、适应新信息并执行类似人类活动的能力。人工智能的应用包括专家系统、自然语言处理(nlp)、语音识别和机器视觉。
ai的复兴
enclustra
在经历了几波乐观和失望之后,人们对人工智能产生了新的兴趣,而且越来越感兴趣。在过去15年左右的时间里,成千上万的人工智能初创公司成立了,而且速度在不断增长。这背后有几个驱动因素:可能最重要的一个是现在可以以承担得起的价格获得巨大的计算能力。不仅硬件更快,而且现在每个人都可以访问云中的超级计算机。这使得运行人工智能所需的硬件平台变得大众化,使得初创企业得以大量涌现。
图1:一种具有2个隐含层的前馈人工神经网络的简化视图
enclustra
人工神经网络(图1)现在扩展到几十到几百个隐藏层节点(图2)。即使是有10000个隐藏层的网络也已经实现了。这种进化正在增加神经网络的抽象能力,并使新的应用成为可能。如今,神经网络可以在数万个cpu或gpu核上进行训练,大大加快了开发广义学习模型的过程。
图2:imagenet识别挑战获胜者展示了在新的神经网络架构中不断增加的隐藏层
enclustra
人们对人工智能兴趣增加的另一个原因是近年来机器学习方面的突破性进展。这有助于吸引科技投资和初创企业的兴趣,进一步加速人工智能的发展和完善。
机器如何学习
enclustra
人工神经网络是一种受人脑启发的计算模型。它由一个简单的处理单元相互连接的网络组成,这些网络可以通过修改它们的连接来学习经验(图1)。所谓的深度神经网络(dnn -具有许多隐藏层的神经网络)目前为许多大型计算问题提供了最佳解决方案。
目前应用最广泛的深度学习系统是卷积神经网络(convolutional neural network, cnns)。这些系统使用前馈的人工神经元网络将输入特征映射到输出,他们使用反向馈入系统进行学习(即训练),并产生一组权重来校准cnn(反向传播,图3)。
图片图3:神经网络需要经过训练来学习如何解决问题或挑战
enclustra
机器学习中计算强度最大的过程是训练神经网络。对于一个最先进的网络来说,它可能需要数天到数周的时间,需要数十亿的浮点计算和大量的训练数据(gbyte到数百gbyte),直到网络达到所需的精度。幸运的是,这个步骤在大多数情况下都不需要时间限制,并且可以转移到云上。
当网络接受训练时,它可以被输入一个新的、未标记的数据集,并根据它之前学习的数据对数据进行分类。这一步称为推断,是开发应用的实际目标。
告诉我你看到了什么
enclustra
输入的分类可以在云中进行,也可以在边缘(大部分是离线)进行。虽然通过神经网络处理数据通常需要专用加速器(fpga、gpu、dsp或asic),但额外的任务最好由cpu处理,cpu可以用传统的编程语言编程。这就是带有集成cpu(所谓的片上系统(soc))的fpga的优势所在,尤其是在边缘。soc将推理加速器(fpga阵列)和cpu组合在一块芯片中。cpu运行控制算法和数据流管理。同时,与基于gpu或asic的解决方案相比,fpga提供了许多优势,其中包括易于集成多个接口和传感器,以及适应新神经网络架构的灵活性(图4)。
图4:人工智能推理应用的不同技术的比较
enclustra
fpga固有的可重构性也使其能够利用不断演化的神经网络拓扑、更新的传感器类型和配置,以及更新的软件算法。使用soc可以在需要时保证低而确定的延迟,例如,用于实时对象检测。同时,soc也非常节能。从fpga中获得最佳性能的主要挑战是在不失去精度的情况下将浮点模型有效地映射到定点fpga实现(图5),这就是供应商工具的作用所在。
图5:将浮点模型有效映射到定点fpga实现的过程称为压缩
选择合适的工具
enclustra
现在有很多工具可以帮助我们降低实现第一个ai项目的门槛。例如,vitisai开发工具为用户提供了在fpga上开发和部署用于实时推理的机器学习应用程序的工具。它们支持许多常见的机器学习框架,如caffe和tensorflow,pytorch支持也将很快推出。它们使最先进的神经网络能够有效适应fpga,用于嵌入式人工智能应用(图5)。
enclustra
结合标准的核心板模块(som),如瑞苏盈科的火星xu3(图6)(基于xilinx zynq ultrascale+ mpsoc),插入火星st3底板,人工智能应用可以比以往更快地实现(图7)。
图7:已被业界证实的人工智能应用解决方案,基于xilinx zynq ultrascale+ mpsoc
enclustra
为了展示这种组合的性能和快速上市能力,瑞苏盈科在短短几天内开发了一个基于人工智能的图像识别系统。这些图像是用一个连接到火星st3底板的标准usb摄像头拍摄的。如需更高的性能,可使用底板上的mipi接口。
该神经网络以低延迟的方式对图像进行分类、在火星xu3核心板模块上运行。该系统支持流行的神经网络如resnet-50和densenet,两者分别用于图像分类和实时人脸检测。
单个fpga模块不仅可以运行神经网络推理,还可以并行处理许多其他任务,如与主机pc和其他外围设备通信。而且,同时控制各种高动态驱动器是fpga技术发挥其优势的地方。例如,添加瑞苏盈科通用驱动控制器ip核来控制无刷直流电机或步进电机将是轻而易举的事。在边缘利用ai的力量从未如此容易,所以,即刻开启您的项目吧!
LED显示屏的组成、分类与选择
SiFive成功采用台积电N5工艺技术首个SoC
虹科传感器应用案例 | 精确把控飞机燃油质量
IGBT的并联使用方法介绍
CMOS与TTL电路的详细对比区别
选择合适的工具——轻松玩转AI
预计2020年我国以太网交换机市场规模约为41.1亿美元
无线风管风速传感器概述、选型及应用
毫米波是5G不可或缺的一部分,球5G毫米波产业蓄势待发
为什么日本机器人产业能够几十年来始终保持高速发展?
冰箱延时保护器电路
基于实时嵌入式系统的自动驾驶系统HiL测试平台
超小型模数转换器提升低功耗的医疗设计电路图及原理
思客琦、大族激光、逸飞激光、智佳能4家企业申报了设备类奖项
便携式蓝牙+WiFi扬声器的制作
基于IC的热插拔电路保护的优势
格力申请AR专利,保护女性夜路安全
智能汽车,芯片厂商新的主战场
映翰通推出工业机器人远程联网解决方案
了解笔记本电脑电池的记忆效应及简单处理方法