作者trfmk1 (TRF小兵)
看板PC_Shopping
标题Re: [心得] ComfyUI 7.0 RX 9070XT便携包分享
时间Wed Jan 14 00:31:56 2026
ComfyUI for AMD RDNA4便携包更新
更新到ROCm7.2 20260110
https://drive.google.com/file/d/1Qba3rKO5eInaRgdchNlZ9XEHI5PKfO8D/view?usp=sharing
此便携包只针对AMD RX9070XT做调整
但RDNA4家族应该都可以使用
9070XT、9070GRE、9060XT
常用节点我都装进去了
里面没有模型
请自行去下载
下载解压就直接可用
使用最新的红石驱动也能跑
此版本已装上
triton 3.5.1-windows.post24
sage attention 1.0.6
目前ROCm7.2每夜版
已经针对9070XT
修复在Win上开启MI OPEM的一些问题
Composable Kernel也已经初步支援
还有蛮多地方要优化的
但VAE编解码会卡死的问题已经解决
目前跑图已经不需要开分块
总之等月底的新驱动吧
AMD adrenaline 26.1.1
将在2026 1/26推出
驱动将会整合RCOm7.2
等TheRock团队
将之後CK的优化算法补进去的话
应该跑图速度还会在提昇一些
我还弄一点小更新
1.我在根目录新增了一个档案
Update ROCm.bat
点击会自动更新最新的RCOm每夜的版本
2.增加一个我自己改的工作流
wan2.2 I2V 4步 官流改 for AMD
它是官方工作流程为基础
针对9070XT去做调整
目前720X720下去跑没有问题
目前节点几乎都是适配N卡
我有在想尝试写一套适合A卡的节点
但还在测试中我就先不分享出来
目前跟西台湾的大佬交流
有人已经在Linux上用9070XT顺跑LTX2模型
有人连用9070gre在Win上都能跑成功
他们也在犹豫要不要在B站发影片
怕9070XT会涨价= =
下面是建议补充的安装
MSVC装上X64版本
https://learn.microsoft.com/zh-tw/cpp/windows/latest-supported-vc-redist?view=msvc-170
MSVC这个一定要安装
triton 编译时会用到
下面是建议也装一装
迟早会用到
安装AMD HIP SDK 目前最新6.4.2
https://www.amd.com/zh-tw/developer/resources/rocm-hub/hip-sdk.html
Git安装
https://github.com/git-for-windows/git/releases/download/v2.47.1.windows.1/Git-2.47.1-64-bit.exe
Python 3.12.10 安装
https://www.python.org/ftp/python/3.12.10/python-3.12.10-amd64.exe
https://i.imgur.com/hr83AwA.png
把Python加入PATH 环境变数记得打勾
我之前有推荐装SD.NEXT
因为MI OPEM修复好了
连带跑图的性能也会提升
新的启动环境变数
BAT参数如下
@echo off
set COMMANDLINE_ARGS= --use-rocm --debug --experimental
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
set PYTHONUTF8=1
set MIOPEN_FIND_MODE=2
set PYTORCH_MIOPEN_SUGGEST_NHWC=0
set MIOPEN_SEARCH_CUTOFF=ON
call webui.bat
SD.NEXT开启MI OPEM
需要将cuDNN enabled 强制打开後
终端机要关掉重启才会生效
https://i.imgur.com/XKo5YAb.png
VAE分块也不需要了
https://i.imgur.com/iNqQl9e.png
现在SD XL可以直接去跑1080X1440
https://i.imgur.com/a6q1PvW.png
30步 9秒跑完
如果将模型量化成FP8可以再缩短1-2秒
http://i.imgur.com/2Spk9rB.jpg
1080X1440 1次跑4张
https://i.imgur.com/do6D9Lb.png
顶爆显存也不会崩溃
1080X1440
https://i.imgur.com/lEblv11.png
直接跑1920X1440
出图也不是问题
http://i.imgur.com/C1zTIpn.jpg
-----
Sent from JPTT on my Sony XQ-EC72.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 110.28.57.174 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1768321922.A.DD8.html
1F:→ twinkleAshed: PYTORCH_MIOPEN_SUGGEST_NHWC 114.136.26.210 01/14 01:13
2F:→ twinkleAshed: 我记得上游已经修掉了. 114.136.26.210 01/14 01:13
3F:→ twinkleAshed: upscale跟interpolation不会不会有 114.136.26.210 01/14 01:14
4F:→ twinkleAshed: regression了. 114.136.26.210 01/14 01:14
5F:→ twinkleAshed: *多打一个不会. 114.136.26.210 01/14 01:15
6F:推 Koogeal: 楼主先鸡鸭吧~! 59.115.57.189 01/14 01:15
7F:推 zaku2s: 知世就是力量!111.246.124.232 01/14 01:20
8F:→ twinkleAshed: 就我前几天在Linux上的测试, TheRo 114.136.26.210 01/14 01:23
9F:→ twinkleAshed: ck的miopen并没有包含ck solver, 114.136.26.210 01/14 01:23
10F:→ twinkleAshed: 想要3D implicit GEMM solution 114.136.26.210 01/14 01:23
11F:→ twinkleAshed: 的话, miopen得要另外build. 114.136.26.210 01/14 01:23
12F:推 NX9999: 暂时用不到但推推,感谢@@210.209.176.103 01/14 01:24
13F:推 pcfox: 战未来 36.231.67.83 01/14 01:33
14F:推 sheng76314: 好耶 122.121.68.171 01/14 01:39
15F:推 xzero0911: 原来A卡也能用sage attention 114.34.51.252 01/14 02:30
16F:→ xzero0911: 还以为这东西N卡独占 好猛… 114.34.51.252 01/14 02:30
17F:推 ShibaTatsuya: 推优文 203.204.7.54 01/14 04:12
18F:→ ShibaTatsuya: 有机会来用我的9070 GRE试玩看看 203.204.7.54 01/14 04:12
19F:推 yeeouo: 必须多算几张NSFW 114.38.5.235 01/14 04:22
20F:推 MyFairyTal: 太神啦 220.129.150.5 01/14 06:37
21F:推 armfire1911: 方便问一下5080有哪个整合包适合吗 42.71.67.179 01/14 07:29
22F:→ armfire1911: ?二次元图片&影片Gen的话,刚换电 42.71.67.179 01/14 07:29
23F:→ armfire1911: 脑手痒了 42.71.67.179 01/14 07:29
24F:→ leo255112: 老哥真是佛心来着 42.73.199.244 01/14 07:43
25F:推 zseineo: 推 1.160.22.146 01/14 07:44
26F:推 crazycy: 感谢情报 49.218.137.156 01/14 07:51
27F:推 avans: 推推优文 111.71.4.232 01/14 08:27
28F:推 mizumutsuki: 问个蠢蠢的问题,是不是8G一定不能跑 42.72.229.56 01/14 08:35
29F:→ mizumutsuki: AI 42.72.229.56 01/14 08:35
VRAM不够就会就会用到系统记忆体
系统记忆体不够就会用到虚拟记忆体
就是用你的硬碟当缓存去跑
因为系统记忆体会跟虚拟记忆体
不断频繁的交换资料瞎忙
系统会没记忆体可用卡死
然後吐出来的资料GPU一下子就跑完了
结果就是GPU在那边偷懒跑起来很慢
可能几分钟就可以完成的事
变成要几个小时才能完成
30F:推 coox: 大哥真是A卡社群的重要战力 163.26.206.202 01/14 08:38
31F:→ gbcg9725: 8g可以跑,但看你要跑啥 27.242.166.166 01/14 08:43
32F:→ gbcg9725: 影片的话还是要花很多时间或是采用低精 27.242.166.166 01/14 08:44
33F:→ gbcg9725: 度模型 27.242.166.166 01/14 08:44
34F:→ gbcg9725: 效果会差一些 27.242.166.166 01/14 08:44
35F:→ gbcg9725: 纯图片能等的话问题不大 27.242.166.166 01/14 08:45
※ 编辑: trfmk1 (110.28.57.174 台湾), 01/14/2026 09:29:26
36F:推 ninnyshadow: 推一下 我等着直上R9700 124.219.98.35 01/14 09:34
37F:→ avans: 现在有cpu offload的机制,只要ram够大8g基 111.71.4.232 01/14 09:56
38F:→ avans: 本上也能跑,不过模型越来越大的情况还是 111.71.4.232 01/14 09:57
39F:→ avans: 会跑的很吃力 111.71.4.232 01/14 09:57
40F:推 nrsair: 强 49.217.127.139 01/14 10:08
41F:推 WeasoN: 推 220.133.186.61 01/14 10:09
42F:推 item0606: 推 这时间来试试看 49.215.48.233 01/14 10:32
43F:→ Ark727: 推推 101.10.164.221 01/14 11:24
44F:推 felaray: 推推 114.36.26.161 01/14 11:58
45F:→ vsbrm: 苏妈应该付你薪水,多来几个人负责 开源AI 223.138.73.115 01/14 12:03
46F:→ vsbrm: 整合包或是一键安装包之类,对A卡推广会满 223.138.73.115 01/14 12:03
47F:→ vsbrm: 有帮助 223.138.73.115 01/14 12:03
ComfyUI桌面版
其实已经正式支援AMD显卡
只是有些工作流节点必须自己优化
大多都是适配N卡
有些节点抓不到N卡环境就报错
我只是刚好有兴趣在玩
现在环境比较稳定些了
就顺便打包分享出来
※ 编辑: trfmk1 (110.28.57.174 台湾), 01/14/2026 12:30:08
48F:推 a91031309: 太专业了,优文推 27.247.69.44 01/14 12:31
49F:→ mizumutsuki: 原来8G也能画图,只是比较慢,感谢!! 1.169.243.227 01/14 12:49
50F:→ lolicat: 那可以省超多 低调推 49.215.242.24 01/14 12:55
51F:推 grtfor: 专业推 106.1.179.172 01/14 13:26
52F:推 losmith: 感谢更新~ 在大大分享的上一包入门了XD 1.163.211.206 01/14 18:40
53F:推 losmith: 非N卡自己弄工作流真的常报错还会崩溃XD 1.163.211.206 01/14 18:43
54F:推 crazycy: 好奇你的WAN2.2 workflow有改了什麽 211.75.82.202 01/14 19:34
55F:推 waitu0526: 好猛 39.14.33.111 01/15 03:00
56F:推 blueballer: 感谢推223.140.218.118 01/15 12:49