nvidia 发布了最新的 nsight 计算 2021.3,它具有用于测量和建模占用率、源代码和汇编代码相关性的新功能,以及用于识别访问缓存造成的瓶颈的分层屋顶线模型。
占用率计算器
nsight compute 2021. 3 添加了一个新的占用率计算器活动,帮助您了解内核的硬件资源利用率,并建模调整如何影响占用率。
占用率是每个 sm 的活动扭曲与活动扭曲理论最大数量的比率。占用率低可能表示内核太小、工作负载不平衡或资源争用。所有这些都会限制 gpu 上具有特定可用资源集的内核的性能。
图 1 nsight 计算占用计算器的显示
命令行源页面
此版本添加了一个高要求的功能,允许直接从命令行从 gui 中的源页面访问信息。通过使用--page source标志,用户可以在命令行上看到源代码行、 ptx 行或程序集行以及这些行的收集指标。
在分析收集的数据以及编写脚本和后期处理结果以进行进一步报告和分析时,此功能提供了额外的灵活性。
图 2 命令行源输出功能的示例。
分层屋顶线
屋顶线图表现在支持分层屋顶线,除了设备内存之外,还为 l1 和 l2 缓存添加屋顶线。您可以查看它们的内核与每个内存级别的带宽限制有多接近,以确定它们的内核是否存在与访问内存相关的瓶颈。
图 3 nsight 计算显示屋顶线层次结构比较。
其他增强功能
进一步的功能包括更多可配置的基线比较、从 cli 直接访问源代码级信息以及附加的 ssh 功能。
关于作者
jackson marusarz 是 nvidia 计算开发工具的产品经理。他关注如何使用工具使所有开发人员能够轻松高效地评测、调试和优化 cuda 代码。杰克逊拥有 boulder 科罗拉多大学计算机工程硕士学位。
chaitrali joshi 是 nvidia 的产品营销经理,专注于电信 5g 系统的设计和开发。她对网络空间有着深入的了解,是移动通信系统和云栈方面的专家。在英特尔之前,她是一名领导,向开发人员宣传电信技术和边缘计算技术。她获得了加利福尼亚大学计算机科学硕士学位,戴维斯专注于软件定义的网络和多址边缘计算( mec )。
接下来任天堂的游戏春天将要如何发展?
特斯拉Model Y有望拉动新一轮的动力电池配套
数智赋能 格创东智为中小企业提供“链式”数字化解决方案
迎接世界杯 “万能的小米”推出智能足球
分布式Wi-Fi——并非听起来那么简单
通过NSight Compute 2021.3优化GPU利用率
约束异步时钟的方法
理想汽车将申请配售4700万美国存托股票用于纯电动车技术研发
智慧中台AAAS
高度关注!2022开放原子开源峰会最新议程一览
微流控芯片技术可助力医疗电子
基于可穿戴声学设备的高度跟踪系统,助力精确监测有创动脉血压
半桥谐振LLC+CoolMOS开关管工作原理和作用
功率放大器市场开启乱战模式 前景依然乐观
中兴通讯:重装归来,开启折叠智能手机全新品类
苏黎世大学的新算法使得无人机可在城市街道自由穿梭
电气二次常见问题有哪些_40个电气二次常见问题盘点
土壤团聚体分析仪是什么,它的作用是什么
荣耀Magic2和小米MIX3哪个最好
大多数灾难恢复(DR)系统不如人意?