网站地图官方微信:
网站首页 方村镇 金珠镇 新丰乡 旧店镇 成武县 天福镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么人到中年,很少有身材苗条的? |

    35+啦,也快步入中年了。 身材不胖不瘦,还算正常。 平时喜...

    查看详情>>
  • | 现在个人博客不能备案了吗? |

  • | 为什么没人提微软裁员? |

  • | 如何看待台湾省陆委会威胁国民党抗日老兵参加9.3阅兵会剥夺退休金? |

  • | 为什么 WeGame 在国内竞争不过 Steam ? |

  • | PHP现在真的已经过时了吗? |

  • | 你是在哪一瞬间突然感觉到苹果创新乏力的? |

  • | 既然显卡发热量那么大,为什么不把热量收集利用起来,比如烧水和供暖? |

  • | 有哪些让你目瞪口呆的 Bug ? |

  • | 亚洲体坛最漂亮的十位女运动员都有谁? |

  • | 亲眼见到明星本人是什么体验? |

  • 买一台境外的服务器,再买一台境内的服务器。 配置要一样。 ...

    2025-06-26
  • ZEN1出来前的7700k,4c8t卖2k,大家应该还历历在...

    2025-06-26
  • 前两年有个电影叫……皮囊之下 话说评分还是很高的,这里面...

    2025-06-26
  • Ive的传记写的很清楚,乔布斯规定只有九个人可以直接向他汇报...

    2025-06-26

关注我们

添加微信好友,关注最新动态