开发者工具
CUDA Tile Kernel分析
NVIDIA Nsight Compute 2025.4增加了对分析CUDA Tile Kernel的支持。
更新包括:
- 摘要页面上新的「Result Type(结果类型)」列,用于区分Tile与SIMT Kernel。
- 详情页面上新的「Tile Statistics(Tile统计)」部分总结了Tile维度和重要管道的利用率。
- 源页面还支持将指标映射到高级cuTile Kernel源码。
此外,还增加了对分析设备启动的Graph中的CUDA Graph节点的支持,以及源页面导航的改进,为编译器生成和用户生成的标签提供了可点击的链接。

Nsight Compute分析概况,突出显示了分析输出的Tile Statistics部分
编译时修补
NVIDIA Compute Sanitizer 2025.4通过-fdevice-sanitize=memcheck编译器标志增加了对CUDA编译器(NVCC)编译时修补的支持。这种修补增强了内存错误检测并提高了Compute Sanitizer的性能。
编译时插桩将错误检测直接集成到NVCC中,以实现更快的运行速度,同时通过高级的基址和边界分析捕获更隐蔽的内存问题,例如相邻分配之间的非法访问。
这意味着用户可以在不牺牲速度的情况下调试内存问题,运行更多测试并保持生产力。










