最新PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
新智元报道编辑:乔杨Frey【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与安装的PyTorch匹配!!!」而企图炸键盘?无论是TensorFlow还是Pytorch,GPU和CUDA搭配的概念早已深入骨髓。