网站地图官方微信:
网站首页 苏基镇 回马镇 日星乡 默勒镇 优云乡 竹南镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 鸿蒙 arkTS的编译器解析器是什么?怎么理解? |

    曾经给鸿蒙方舟界面引擎(ark-ui-engine)修复过几...

    查看详情>>
  • | J***aScript 已经强大到什么程度了? |

  • | Golang与Rust哪个语言会是今后的主流? |

  • | 哪个牌子的护肤品好呀?想给妈妈买一套抗衰老的护肤品? |

  • | 北京日报点名批评“苏超”过度娱乐化的动机是什么? |

  • | systemd吞并了什么? |

  • | 对方酒驾,我们提出私了要了3.5W,会被认为敲诈勒索吗? |

  • | 中国女篮张子宇身高 2 米 26 制霸赛场,身高因素在篮球比赛中能占多大优势?她会是下一个「姚明」吗? |

  • | 大模型 Agent 是不是就是各种 Prompt 的堆叠? |

  • | 如何看待 Mac mini M4 支持可更换 SSD? |

  • | 你卡过最厉害的bug是什么? |

  • 北京,挤地铁…… 那天,我觉得穿的压力裤袜很紧,拿手捏一下捏...

    2025-06-18
  • 头几年业主群里有个女的加我老婆微信,说自己是我家楼下的业主,...

    2025-06-18
  • 我估计了一下,大概可以做到百元以内,大概率免费。 使用Clo...

    2025-06-18
  • 现在我国为啥在国防不藏着掖着了?有什么武器亮什么武器 这次更...

    2025-06-18

关注我们

添加微信好友,关注最新动态