作者ZMTL (Zaious.)
看板AI_Art
標題Fw: [情報] Stable Diffusion on RDNA3 (AI 繪圖)
時間Fri Dec 23 16:51:15 2022
※ [本文轉錄自 PC_Shopping 看板 #1ZekvCXj ]
作者: oopFoo (3d) 看板: PC_Shopping
標題: [情報] Stable Diffusion on RDNA3 (AI 繪圖)
時間: Wed Dec 21 19:30:11 2022
https://nod.ai/sd-on-rdna3/
Nod.ai 跟 AMD合作,移植Stable Diffusion到AMD繪圖卡。
目前需要特別driver
https://www.amd.com/en/support/kb/release-notes/rn-rad-win-22-11-1-mlir-iree
https://tinyurl.com/mrze9hfy
win 11更新的時候,可能要重新安裝驅動。
安裝方式跟注意事項
https://github.com/nod-ai/SHARK/blob/main/shark/examples/shark_inference/stable_diffusion/stable_diffusion_amd.md
https://tinyurl.com/bdcvuhhy
安裝程式在這
https://github.com/nod-ai/SHARK/releases/download/20221220.400/shark_sd_20221220_400.exe
https://tinyurl.com/4na4z5wu
也許RDNA2跟更舊的AMD卡也可以用。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/PC_Shopping/M.1671622220.A.86D.html
1F:→ spfy: 竟然是官方跑出來做這件事嗎 厲害了 12/21 19:41
2F:推 ltytw: 畢竟AMD是做工作卡 (? 12/21 19:47
3F:推 arrenwu: 起頭一定要AMD自己做啊 他們現在整在努力推廣 ROCm 12/21 19:56
4F:→ arrenwu: 目前策略看起來是 AMD起頭->開源後讓大家繼續做 12/21 19:56
5F:推 dos01: 覺得這樣做是正確的 N也是跟很多遊戲廠合作 針對遊戲去調整 12/21 20:06
6F:→ dos01: 不過這過程大概要累積好幾年才會有相對應的成果就是了 12/21 20:07
7F:推 suyuan: 這絕對是正確的方向,畢竟雞雞是人類進步的原動力 12/21 20:20
8F:→ CORYCHAN: 棒棒 12/21 20:21
9F:→ tomsawyer: 你第二個短連結怪怪的 12/21 20:23
還真的怪,已修正
10F:推 dibblo: AMD戰未來!未來最棒(錯棚.. 12/21 20:29
11F:→ cohj: 用apu+16g vram跑模型不知道有沒有機會 12/21 20:43
12F:推 twosheep0603: ROCm資源再給多一點 老黃就不能靠CUDA亂喊價了 12/21 20:53
13F:推 zion1981: 現在滿街gsync相容螢幕也歸功於amd推廣免費freesync 12/21 22:59
14F:推 tint: 目前桌面APU的架構都是舊VEGA(GCN 5.0) GPU的架構偏老了 12/21 23:21
15F:→ tint: 我覺得至少要RDNA2以上架構的才有機會 Rembrandt或之後的 12/21 23:22
16F:→ tint: 不過桌面Zen4 Raphael裡面都有基本的2CU等級的亮機內顯 12/21 23:27
17F:→ tint: 那個是RDNA2架構的 雖然CU數非常少運算能力很低XD 12/21 23:28
apu真的有點難,頻寬,cu都不足。
※ 編輯: oopFoo (219.70.128.119 臺灣), 12/22/2022 00:54:13
18F:→ hitsukiaoi: 非NV不可的原因又少一個了 12/22 01:35
19F:→ chickengod: 讚 12/22 01:40
20F:→ DrGun: 難道AMD又臭了嗎?? 12/22 01:55
21F:→ oopFoo: 有人用5700xt(rdna1)跑,45秒。還蠻不錯的。 12/22 08:25
22F:推 menchian: 說跑幾秒沒啥參考性吧,你下的參數不同,可以有幾秒鐘跟 12/22 09:53
23F:→ menchian: 幾十分鐘的差距,更別說每個人套用的模型可能都不同 12/22 09:53
24F:→ oopFoo: 他用onnx跑4分鐘多,ROCM跑2分多鐘,這個30秒同樣prompt 12/22 10:06
25F:推 wres666: 原來ROCM效率這麼差喔 12/22 10:30
26F:推 keyword1983: 感覺不同runtime compile出來的效率差很多 12/22 14:48
27F:推 MrDisgrace: 連AI也補上了 12/22 15:12
28F:→ Wilson310: 有的跑不錯了 12/22 23:02
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: ZMTL (123.194.160.246 臺灣), 12/23/2022 16:51:15