Lazy loaded image
💩AMD 9070xt 显卡使用 WSL 搭建 ROCm+PyTorch 环境(2025.5 尝鲜)
字数 1093阅读时长 3 分钟
2025-5-4
2025-5-8
type
status
date
slug
summary
tags
category
icon
password
最近换显卡了,在 50 系的持续耍猴下我选择买了 9070xt 这张游戏神卡,于是准备折腾下 PyTorch 环境看看到底能不能用。本文发布的时候,官方版本的 ROCm(6.4) 实际上还是不支持 9070xt 的,需要加点特技才能跑起来,下面是我自己折腾出来的一些经验。
 
值的一提的是,在现在这个时间点(2025.5.4),即使你按照我的方法把 ROCm+PyTorch 装上了,性能也是十分垃圾的,据网上说甚至还不如 2070,我估计是现在 ROCm 官方还没对 RNDA4 架构做深度优化的原因。
 
关于 ROCm 暂时不支持 9000 系列 A 卡(RNDA4)的 Issue 在这里,后续官方应该会更新到无痛支持并且大幅提升性能:
 
下面进入正题。

安装 WSL

ROCm 目前只能在 linux 上使用,想要在 Windows 下使用 ROCm 就只能选择 WSL。我们首先在系统设置中把 WSL 可选功能打开并重新启动:
notion image
 
自行启用魔法后安装 WSL 管理器本体:
 
列出可选发行版:
 
选择想要的发行版并安装,我使用的是 Ubuntu-24.04:
 
使用这个指令安装太慢的话也可以在 Microsoft Store 搜索然后下载:
notion image
 
完成安装后在 Windows 开始菜单搜索 WSL Settings,进入后把网络模式改成桥接,这样就可以共享 Windows 的魔法了:
notion image
 
修改之后需要彻底重启 WSL 生效:
 
之后使用 Windows Terminal 进入 WSL 就可以了:
notion image
 
后续的所有软件安装都在 WSL 中进行。

安装 ROCm

最新版本的安装教程在这里,指令按照这里的自行进行更新,本文以 6.4 为例:
 
选择自己对应的 Ubuntu 版本找到 amdgpu-install 安装指令并安装,例如我这里是:
 
接着使用 amdgpu-install 安装 rocm:
 
之后重启 WSL(Windows 下 wsl —-shutdown)。完成之后如果使用 rocminfo 确认信息时候有 Agent 输出就可以了:
 
例如我的输出机器上显示有两个 Agent,分别是 CPU R9 9950x 和 GPU 9070xt,请确认你的显卡显示在 Agent 信息中。

安装 PyTorch

PyTorch 需要使用 AMD Repo 上版本,安装文档在这里:
 
这里我用的 ROCm 版本是 6.4,Python 版本是 3.12,可以根据文档里的链接自己去 AMD Repo 里面找 whl 文件,我这里最后的安装指令是:
 
完成安装之后我们需要替换 torch 中的 WSL 兼容层(这一步很重要,你按照 ROCm 官方的文档装可能就会因为这一步导致最后 PyTorch cuda.is_available 返回 False),libhsa-runtime64.so 的版本可能有所不同,需要自行修改下命令行,我这里的是:
 
最后使用下面指令检查 torch 是否成功安装以及识别显卡:
 
这里我的输出:
 
输出这样就确认完成了,amdsmi 那个 warning 可以忽略,不影响正常使用,看网上说是因为使用 WSL 导致的。到这里为止,PyTorch 的环境就算折腾完成了。后续正常使用就行了,搞整各种 AI 应用都行,不过看 Reddit 上人家测的 Stable Diffusion 性能真的很糟糕,甚至都不如老点的 A 卡,这个点只能说是尝鲜,后面还是等 ROCm 出了官方 RDNA4 架构支持再按官方文档弄比较靠谱。
 
 
上一篇
利用 C++ Concepts 做编译期检查
下一篇
使用 TMate 调试 Github Actions

评论
Loading...