网站地图官方微信:
网站首页 包装制品配附件 包装项目合作 包装胶带 包装防伪 学习文具 信封

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别? |

    类比一下,如果把「安装程序到你的电脑」比作「将钱存入你的银行...

    查看详情>>
  • | 作为一个腰细腿粗的女生什么感觉? |

  • | 电脑系统崩溃如何重装系统? |

  • | 用K8s的公司有多少人会部署K8s? |

  • | 为什么董明珠攻击小米空调,而公牛却没有攻击小米插座? |

  • | 汉语是牺牲了什么,才成为世界最紧凑、最高效的语言? |

  • | 如何在不重装系统和软件的情况下换系统盘? |

  • | 为什么买的小乌龟总是养不活呀? |

  • | M4 Mac mini2024款,这种主机到底怎么样呀? |

  • | 编程语言 MoonBit 发布 Beta 版,正式进入企业场景应用,会带来哪些影响? |

  • | 手术时把大脑拿出来还能接回去吗? |

  • 没有这个bug。 比如,你提议“加沙立即停火”,被美国一票...

    2025-06-27
  • 换成丰田,大众在内地建厂,不用本地工人,也不给那些工人办好外...

    2025-06-27
  • 福州有一家公司叫网龙,前十来年的时候我投了简历,HR通知我入...

    2025-06-26
  • 兄弟,给你个建议,低成本玩转nas。 去买个aliyun ...

    2025-06-26

关注我们

添加微信好友,关注最新动态