作者ZMTL (Zaious.)
看板AI_Art
标题Fw: [情报] Stable Diffusion on RDNA3 (AI 绘图)
时间Fri Dec 23 16:51:15 2022
※ [本文转录自 PC_Shopping 看板 #1ZekvCXj ]
作者: oopFoo (3d) 看板: PC_Shopping
标题: [情报] Stable Diffusion on RDNA3 (AI 绘图)
时间: Wed Dec 21 19:30:11 2022
https://nod.ai/sd-on-rdna3/
Nod.ai 跟 AMD合作,移植Stable Diffusion到AMD绘图卡。
目前需要特别driver
https://www.amd.com/en/support/kb/release-notes/rn-rad-win-22-11-1-mlir-iree
https://tinyurl.com/mrze9hfy
win 11更新的时候,可能要重新安装驱动。
安装方式跟注意事项
https://github.com/nod-ai/SHARK/blob/main/shark/examples/shark_inference/stable_diffusion/stable_diffusion_amd.md
https://tinyurl.com/bdcvuhhy
安装程式在这
https://github.com/nod-ai/SHARK/releases/download/20221220.400/shark_sd_20221220_400.exe
https://tinyurl.com/4na4z5wu
也许RDNA2跟更旧的AMD卡也可以用。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 219.70.128.119 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/PC_Shopping/M.1671622220.A.86D.html
1F:→ spfy: 竟然是官方跑出来做这件事吗 厉害了 12/21 19:41
2F:推 ltytw: 毕竟AMD是做工作卡 (? 12/21 19:47
3F:推 arrenwu: 起头一定要AMD自己做啊 他们现在整在努力推广 ROCm 12/21 19:56
4F:→ arrenwu: 目前策略看起来是 AMD起头->开源後让大家继续做 12/21 19:56
5F:推 dos01: 觉得这样做是正确的 N也是跟很多游戏厂合作 针对游戏去调整 12/21 20:06
6F:→ dos01: 不过这过程大概要累积好几年才会有相对应的成果就是了 12/21 20:07
7F:推 suyuan: 这绝对是正确的方向,毕竟鸡鸡是人类进步的原动力 12/21 20:20
8F:→ CORYCHAN: 棒棒 12/21 20:21
9F:→ tomsawyer: 你第二个短连结怪怪的 12/21 20:23
还真的怪,已修正
10F:推 dibblo: AMD战未来!未来最棒(错棚.. 12/21 20:29
11F:→ cohj: 用apu+16g vram跑模型不知道有没有机会 12/21 20:43
12F:推 twosheep0603: ROCm资源再给多一点 老黄就不能靠CUDA乱喊价了 12/21 20:53
13F:推 zion1981: 现在满街gsync相容萤幕也归功於amd推广免费freesync 12/21 22:59
14F:推 tint: 目前桌面APU的架构都是旧VEGA(GCN 5.0) GPU的架构偏老了 12/21 23:21
15F:→ tint: 我觉得至少要RDNA2以上架构的才有机会 Rembrandt或之後的 12/21 23:22
16F:→ tint: 不过桌面Zen4 Raphael里面都有基本的2CU等级的亮机内显 12/21 23:27
17F:→ tint: 那个是RDNA2架构的 虽然CU数非常少运算能力很低XD 12/21 23:28
apu真的有点难,频宽,cu都不足。
※ 编辑: oopFoo (219.70.128.119 台湾), 12/22/2022 00:54:13
18F:→ hitsukiaoi: 非NV不可的原因又少一个了 12/22 01:35
19F:→ chickengod: 赞 12/22 01:40
20F:→ DrGun: 难道AMD又臭了吗?? 12/22 01:55
21F:→ oopFoo: 有人用5700xt(rdna1)跑,45秒。还蛮不错的。 12/22 08:25
22F:推 menchian: 说跑几秒没啥参考性吧,你下的参数不同,可以有几秒钟跟 12/22 09:53
23F:→ menchian: 几十分钟的差距,更别说每个人套用的模型可能都不同 12/22 09:53
24F:→ oopFoo: 他用onnx跑4分钟多,ROCM跑2分多钟,这个30秒同样prompt 12/22 10:06
25F:推 wres666: 原来ROCM效率这麽差喔 12/22 10:30
26F:推 keyword1983: 感觉不同runtime compile出来的效率差很多 12/22 14:48
27F:推 MrDisgrace: 连AI也补上了 12/22 15:12
28F:→ Wilson310: 有的跑不错了 12/22 23:02
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: ZMTL (123.194.160.246 台湾), 12/23/2022 16:51:15