网站地图官方微信:
网站首页 龙廷乡 古桥镇 江岸区 乾塘镇 碑记镇 吉河镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 显示器选32还是27,2k还是4k? |

    依我之见,32英寸在大部分时候优于27英寸,除非桌子太小不适...

    查看详情>>
  • | 导师给了1.4W要我给工作室买个主机,是整机还是自己配? |

  • | 以色列为什么要打伊朗? |

  • | 阿里网盘为什么没有动静了? |

  • | 你在出租房屋发现过什么前租客留下的“宝藏”? |

  • | 大三做的海报,离就业差多远? |

  • | 如何看待国内服装尺码越来越小的现象? |

  • | 2025年6月了,深圳房价咋样? |

  • | 现在网上把清朝说得一无是处,但是为什么能统治268年? |

  • | 为什么中国防空反导系统才7年就从山寨到全面原创且超越了俄罗斯? |

  • | 你怎么看待剪映收费过高问题? |

  • Electron既不是游戏引擎,也不是新时代,也不会带来变革...

    2025-06-23
  • 01前几天,广州一家奶茶店门口发生的一幕,被挂上了热搜。 ...

    2025-06-23
  • 最关键是做不大。 CRT最后的绝唱出现在08年,当时一波看...

    2025-06-23
  • 别说一个Linux系统,我一个移动硬盘里装了ventoy+上...

    2025-06-23

关注我们

添加微信好友,关注最新动态