PyTorch 1.8正式官宣发布还支持AMD GPU!

导读
pytorch1.8来啦!1.8版本中,官方终于加入了对amd rocm的支持,可以方便的在原生环境下运行,不用去配置docker了。 1.8版本中,官方终于加入了对amd rocm的支持,可以方便的在原生环境下运行,不用去配置docker了。
amd rocm只支持linux操作系统
1.8版本集合了自2020年10月1.7发布以来的超过3000次github提交。此外,本次更新还有诸多亮点:
优化代码,更新编译器
python内函数转换
增强分布式训练
新的移动端教程与演示
新的性能检测工具
相关的库torchcsprng, torchvision, torchtext和torchaudio也会随之更新。要注意的是,自1.6起,pytorch新特性将分为stable、beta、prototype三种版本。其中prototype不会包含到稳定发行版中,需要从nightly版本自行编译。
python to python函数转换
新增的beta特性torch.fx可以实现python到python的函数转换,可以方便的加入任何工作流程。新的api,向numpy学习!
1.7版本中增加的beta特性torch.fft已成为正式特性。实现了与numpy中的np.fft类似的快速傅立叶变换,还增加了硬件加速支持与自动求导,以更好的支持科学计算。还增加了beta版numpy风格的线性代数模块torch.linalg,支持cholesky分解、行列式、特征值等功能。
增强分布式训练
增加了稳定的异步错误与超时处理,增加nccl的可靠性。增加了beta版的流水线并行功能*(pipeline parallelism)*,可将数据拆解成更小的块以提高并行计算效率。
pipeline parallelism使用4个gpu时的工作示意图
增加beta版的ddp通讯钩子,用于控制如何在workers之间同步梯度。
另外还有一些prototype版的分布式训练新特性。
zeroredundancyoptimizer:用于减少所有参与进程的内存占用。
process group nccl send/recv:让用户可在python而不是c++上进行集合运算。
cuda-support in rpc using tensorpipe:增加对n卡多卡运算的效率。
remote module:让用户像操作本地模块一样操作远程模块。
移动端新教程
随本次更新发布了图像分割模型deeplabv3在安卓和ios上的详细教程。以及图像分割、目标检测、神经机器翻译等在安卓和ios上的演示程序,方便大家更快上手。 另外还有pytorch mobile lite interpreter解释器,可以减少运行时文件的大小。
性能检测工具
增加beta版的benchmark utils,用户可以进行精确的性能测试。以及prototype版的fx graph mode quantization,实现了量化过程的自动化。更多新版本详情,见下方链接。


向电动汽车之父致敬 北汽新能源与华为共创 “戴维森实验室”
5G将助力智能医疗行业在未来快速成长
佳能5DMarkIII评测 处理速度相比5DII提升至少4-6倍
芯文芯事丨自动驾驶汽车设计将面临的五大挑战
招投标资讯|院区道路整修及路灯改造工程
PyTorch 1.8正式官宣发布还支持AMD GPU!
LED上市企业2015年的业绩快报TOP20
什么是单片机解密?单片机解密方法
Adobe提出DMV3D:3D生成只需30秒!让文本、图像都动起来的新方法!
选择移动电源的五大建议
金星彩电通病良方-TA两片机(以C542为例)
全面分析下BL(B)/LDR指令
京东方收购南京G8.5公司和成都G8.6公司部分股权
汽车电子压接工艺IEC 60352-5通用测试标准
ColorOS和海信合作 将迎来多家品牌合作
STM32F103系列芯片系统架构
称重传感器的原理_称重传感器的外形构造与测重形式
亚马逊将在欧洲启动空运业务,规模扩大70架飞机
代码的黑盒测试(下)| 库接口测试Library Interface Testing
基士得耶自诊功能表(通用代码)