网站地图官方微信:
网站首页 东亭乡 石壁镇 秀谷镇 青坪镇 横山乡 买巴乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 印度是真的烂还是咱们在信息茧房里面? |

    我是三月份去的新德里,出机场就坐车去萨克特,吃了正宗印度餐,...

    查看详情>>
  • | 现在个人博客不能备案了吗? |

  • | systemd吞并了什么? |

  • | 为什么买了Switch后,却发现它并没有那么好玩? |

  • | 如何评价网传那尔那茜高考179分(含加分)考入上海戏剧学院***? |

  • | 为什么中国JK无法拍出日本JK的感觉? |

  • | Firefox是如何一步一步衰落的? |

  • | 入职第一天有什么瞬间让你马上想离职的? |

  • | Node.js 熄火了吗? |

  • | 字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平? |

  • | 扫黑风暴为什么他们费老大劲杀这么多人不如直接把督导组干掉? |

  • 唐宁最近撸铁照片把我吓一跳,这咋老这么快! 不就去了新西兰才...

    2025-06-21
  • explorer和finder这俩货,其实都挺抽象的。 我来...

    2025-06-21
  • 访达。 用Mac的朋友们应该都很熟悉吧。 就是这个玩...

    2025-06-21
  • C语言中的「泛型」编程,这个代码是我在使用惯了C++之后转头...

    2025-06-21

关注我们

添加微信好友,关注最新动态