既然gpu硬件加速是利用gpu的特长为系统服务,那么好处是什么呢?
这里用时下非常流行的骑游运动做个比方,正常情况下你在骑行的时候只有腿部在进行蹬踩运动(cpu正常运算),而当你遇到诸如顺风、下坡、被人推行等情况时,速度就会加快,并且腿部感觉非常省力(gpu参与运算)。
gpu硬件加速时系统如何运行呢?
现在我们有两个处理器、cpu和gpu,它们之间通过系统总线交换数据。
第一步:cpu从文件系统里读出原始数据,分离出图形数据,然后放在系统内存中,这个时候gpu在发呆。
第二步:cpu准备把图形数据交给gpu,这时系统总线上开始忙了,数据将从系统内存拷贝到gpu的显存里。
第三步:cpu要求gpu开始数据处理,现在换cpu发呆了,而gpu开始忙碌工作。当然cpu还是会定期询问一下gpu忙得怎么样了。
第四步:gpu开始用自己的工作间(gpu核心电路)处理数据,处理后的数据还是放在显存里面,cpu还在继续发呆。
第五步:图形数据处理完成后,gpu告诉cpu,我忙完了,准备输出或者已经输出。于是cpu开始接手,读出下一段数据,并告诉gpu可以歇会了,然后返回第一步。
那么换到电脑上会是什么情况呢?
在以前的很多应用中,cpu是负责所有运算的,而gpu则只是负责最后的显示工作,因此一旦出现处理复杂图形数据的时候,很多使用性能较弱的cpu的电脑系统就开始缓慢无比,而使用性能较强的cpu的电脑系统也会看到cpu资源被大量的占用。
而在gpu开始参与运算之后,原本会消耗cpu大量宝贵资源的图形数据处理部分就全部交给gpu这个专业人士进行处理了,从而降低了cpu的负担,并且利用自身的特长,使得图形数据处理的效率更快,从而提升系统性能。
内存满足不了显卡的需求,显存应运而生:
本是同根生的状况一直持续到sdr和ddr交接的时代,其实最早用在显卡上的ddr颗粒与用在内存上的ddr颗粒仍然是一样的。后来由于gpu特殊的需要,显存颗粒与内存颗粒开始分道扬镳,这其中包括了几方面的因素:
1. gpu需要比cpu更高的带宽。gpu不像cpu那样有大容量二三级缓存,gpu与显存之间的数据交换远比cpu频繁,而且大多都是突发性的数据流,因此gpu比cpu更加渴望得到更高的显存带宽支持。
位宽×频率=带宽,因此提高带宽的方法就是增加位宽和提高频率,但gpu对于位宽和频率的需求还有其它的因素。
2.显卡需要高位宽的显存。显卡pcb空间是有限的,在有限的空间内如何合理的安排显存颗粒,无论高中低端显卡都面临这个问题。
从布线、成本、性能等多种角度来看,显存都需要达到更高的位宽。最早的显存是单颗16bit的芯片,后来升级到32bit,将来甚至还会有更高的规格出现。而内存则没有那么多要求,多年来内存条都是64bit,所以单颗内存颗粒没必要设计成高位宽,只要提高容量就行了,所以位宽一直维持在4/8bit。
3.显卡能让显存达到更高的频率。显存颗粒与gpu配套使用时,一般都经过专门的设计和优化,而不像内存那样有太多顾忌。gpu的显存控制器比cpu或北桥内存控制器性能优异,而且显卡pcb可以随意的进行优化,因此显存一般都能达到更高的频率。而内存受到内存pcb、主板走线、北桥cpu诸多因素的限制很难冲击高频率,由此算来,显存与内存“分家”既是意料之外,又是情理之中的事情了。为了更好地满足显卡gpu的特殊要求,一些厂商(如三星等)推出了专门为图形系统设计的高速ddr显存,称为“graphics double data rate dram”,也就是我们现在常见的gddr。
电子灭蚊灯电路的工作原理解析
Go和Python,Erlang的语言对比分析和Go编程示例概述
2023思尔芯EDA生态大会北京站顺利举办,定档3·15的大会有何精彩?
新基建最大程度提高电桩行业的效率,实现一致对外
WL232A无线串口收发器的原理及固件设计
GPU硬件加速时系统运行步骤
手环你选华为荣耀手环还是小米手环 对比一下谁是腕上新宠
一加6全球销量破100万台 开售仅22天
伟景智能立体相机为国内首台“管道磁浮高精度智能无人巡检车”量身定制智慧眼
PCB CAM软件ezCAM的功能
搭载第一代骁龙8+手机优势对比分析
电脑是什么,电脑芯片由什么组成
机器翻译如何变得有道德
应用于复杂建筑楼宇的传感器系列产品
融合AI,持续创新: ST开启智能感知新时代
宝沃推出“性能版”SUV,被称为宝马的双胞胎兄弟!
焊接工业机器人发展迅速,加快我国制造业发展的步伐
基于Agent的仿真与建模,智慧城市将越来越依赖实时传感器数据的性能
ADI与凌讯在便携设备中集成数字电视解决方案
加密货币将推动所有去中心化金融产品建立在基于Layer 2的稳定币之上