网站地图官方微信:
网站首页 包装相关设备 包装机械 语音室成套设备 学生 削笔器 修正带

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里? |

    先写一个短的结论。 那就是AI Agent = 多个AI大...

    查看详情>>
  • | 为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里? |

  • | 如何看待英雄联盟前职业选手mlxg官司输了,被强制执行2500w? |

  • | 洲际导弹能打到任何地方,为什么还需要轰炸机? |

  • | 海外DoH(DNS over HTTPS)全部不可用了?是否有其他替代方式? |

  • | 你和你老婆是怎么认识的? |

  • | 鸿蒙电脑会在国内逐渐取代windows电脑吗? |

  • | 为什么大家觉得中医一无是处? |

  • | 27寸显示器是否有必要到4K? |

  • | 为什么***骂 Ubuntu,但是 Ubuntu 一直是所有 Linux 发行版中知名度、热度最高的? |

  • | 有没有免费的云服务器? |

  • 应该感谢伊朗袭击和俄乌战争揭露世界真相 譬如图中是伊朗火...

    2025-06-23
  • 我们的一位 USA 客户说,在灯塔国,不识数的现象其实非常普...

    2025-06-23
  • 时间2025.06.11,就聊聊锐龙版吧ThinkBook系...

    2025-06-23
  • 原文16:《春秋》抑诸侯,尊王室,王人虽微,序于诸侯之上,以...

    2025-06-23

关注我们

添加微信好友,关注最新动态