作者ZMTL (Zaious.)

看板PC_Shopping

標題

Fw: [閒聊] RTX3090 單/雙卡本地LLM運算AI電腦心得

時間Sun Apr 5 17:57:19 2026

※ [本文轉錄自 AI_Art 看板 #1fqY_Ppm ] 這篇算是純粹組裝心得文，拋磚引玉給大家參考，目標鎖定跑中規模的開源模型，目前來說是Gemma4 26B-A4B,31B 、Qwen3.5 27B,35B-A3B 基本上，我認為GTX3090是唯一信仰，以前沒有以後也不會有這價位的24GB+ VRAM顯卡了，至於Mac那條路我不熟，有熟的人可以另外補充，但PC架構還是有一定程度的擴充性。先上組好圖 https://imgs.plurk.com/QHO/ESJ/LMCfqiXl7TN0oC1300Y2hCUHhFZ_lg.jpg

https://imgs.plurk.com/QHO/KlS/0f4g0RGTY5fJTcbIahpwkdQK9Qj_lg.jpg

以下是我實際用過的單3090配置 CPU (中央處理器)：i5-12400 MB (主機板)：TUF GAMING B660-PLUS WIFI D4 RAM (記憶體)：金士頓 64GB(32GB*2) DDR4-3200 VGA (顯示卡)：ZOTAC RTX 3090 TRINITY 24G SSD (固態硬碟)：Kingston金士頓 KC3000 1TB M.2 PSU (電源供應器)：全漢 HYDRO G PRO 1000W/金牌/全模 CHASSIS (機殼)：全漢 CMT370 後來有一度上到128GB記憶體，發現真的沒啥用，這張單沒什麼特別的，現在照著張組一台二手的應該也沒什麼問題，唯一的細節是僅適合單3090，要雙3090基本上大半台都要換掉，見以下 ------------ 雙3090配置 CPU (中央處理器)：i5-12400 MB (主機板)：MSI Z690 FORCE WIFI RAM (記憶體)：威剛 64GB(32GB*2) DDR5-4800 VGA (顯示卡)：ZOTAC RTX 3090 TRINITY 24G MSI RTX 3090 Suprim X SSD (固態硬碟)：Kingston金士頓 KC3000 1TB M.2 PSU (電源供應器)：振華 Leadex 1200W CHASSIS (機殼)：Phanteks Enthoo Pro 2 Server Edition + 9 顆 TL-C12C-S 只留下了CPU、SSD、一張3090，沒了，對，就是這麼坑因為雙3090跑LLM，LLM要能把模型拆給兩張跑需要能讓兩張PCIE直連8x/8x的主機板，這個條件，基本上DDR4的主機板中沒有。就連DDR5，也只有部分的690跟790有，同一系690有不代表790有，不要問我為什麼我不知道，Claude的答案是後續的主機板會把槽留給硬碟？是不是8x/8x 最快的判斷方式是看主機板是不是兩張顯卡槽都有顏色舉例來說：這張是(FORCE是CARBON的白色版) https://tw.msi.com/Motherboard/MPG-Z690-CARBON-WIFI 這張不是 https://tw.msi.com/Motherboard/MPG-Z790-CARBON-WIFI 我家AI列出LGA1700符合條件的顯卡如下： MSI MPG Z690 CARBON WiFi MSI MEG Z690 / Z790 ACE (MEG 旗艦級才有保留) MSI MEG Z690 UNIFY / UNIFY-X ASUS ProArt Z690 / Z790-CREATOR WiFi ASUS ROG Maximus 系列 (Z690/Z790 Hero, Extreme) Gigabyte Z690 / Z790 AERO D ASRock Z690 / Z790 Taichi AI可能會有幻覺請自行核對、其他腳位可能也要自己研究。不過幫我組上電腦的資工系朋友說我照著AI開菜單組完幾乎沒買錯東西也是很厲害。 (有啦，Claude建議我買一個風扇Hub ，後來發現利民內建串接了算是個小失誤) 機殼方面，感謝得到來自這篇文的Zenryaku、ack0011以及其他板友的建議 https://webptt.com/m.aspx?n=bbs/PC_Shopping/M.1773376727.A.FCF.html 最後是綜合Claude意見採用Phanteks Enthoo Pro 2 Server Edition 保證顯卡的呼吸空間，優點是整個機殼有15個風扇孔可以裝，吹好吹滿。 https://www.phanteks.com.tw/Enthoo-Pro2-Server.html https://images.plurk.com/rtYk5LSoncMUC6wnrUTR9.png

雖然我目前還是兩張3090疊羅漢，但我覺得應該可以考慮一張拉去旁邊站，這個打算下禮拜再來處理，也請大家再建議一下直立方案 (右邊硬碟下方應該可以對吧，我沒那麼多硬碟) 大家會覺得有點痛的應該還是在漲價後的DRAM上，全新的DDR4 32G一隻大概 6-8000、全新的DDR5 32G 都要上萬了，最後我買二手的DDR5 32Gx2 花了15000，這部分也僅供參考。至於未來會不會跌？我是說不準，但3090我看漲是肯定的。三年前第一張3090我買19000，上個月第二張3090我買24000，現在價錢大家可以自己看看目前規劃上來說，跑本地模型不是為了取代雲端模型。是讓本地模型完成大量基礎、涉及機敏的工作，舉例來說： ‧大量 code review 初篩，只把複雜問題送給 Sonnet/Opus ‧機密文件問答，資料不出門 ‧多代理人架構的執行層，成本歸零 ‧24 小時批次推理，電費比 API 費用省在本地跑 Qwen / Gemma，雲端留給真正需要判斷力的任務。我認為 LLM Router 架構才是 2026 年 AI 工作流的核心建設。 Claude 很厲害，但我不會假設它永遠都在，掌握自己的動態算力，這才是黃仁勳說的 Sovereign AI。以上是不專業分享，歡迎指導，感謝。 -- AI_Art AI藝術/生成式AI板歡迎各方前來討論生成式AI相關議題！ ◆ 從 Human-in-the-Loop → Human-AI Symbiosis (人機共生) ◆ LinkedIn：https://www.linkedin.com/in/zaious/ GitHub ：https://github.com/Zaious ChronicleCore (Multi-Agent Ecosystem) 白皮書： https://github.com/Zaious/ChronicleCore-Architecture --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.27.184.211 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1775382489.A.CF0.html ※ 編輯: ZMTL (114.27.184.211 臺灣), 04/05/2026 17:57:04

※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: ZMTL (114.27.184.211 臺灣), 04/05/2026 17:57:19

1^F：→ ZMTL: 看過板規應該沒什麼冒犯的地方嗎...? 感謝 114.27.184.211 04/05 17:58

2^F：→ ZMTL: 電蝦板尤其是Zenryaku大在我幾次組電腦都給 114.27.184.211 04/05 17:58

3^F：→ ZMTL: 了相當詳盡的意見，希望把一點AI PC的範本 114.27.184.211 04/05 17:58

4^F：→ ZMTL: 轉來板上提供給未來有需要的人參考。 114.27.184.211 04/05 17:58

5^F：推 bobbyac01: 48G跑個30B上下估計只能Q4 也不知道你 1.169.228.66 04/05 18:01

6^F：→ bobbyac01: 有沒有建vLLM SGLang 離生產級好遠 1.169.228.66 04/05 18:01

7^F：推 Luciferspear: 先推再看 1.171.207.231 04/05 18:01

8^F：推 william456: 3090的背板太燙 114.42.243.63 04/05 18:02

9^F：推 jhjhs33504: 單機生產級多工養龍蝦最低IQ2_XXS起跳 36.228.11.93 04/05 18:07

10^F：推 jhjhs33504: 少數模型還有1bit量化技術應該能更省 36.228.11.93 04/05 18:11

11^F：→ ZMTL: 雙3090能跑的模型不可能當龍蝦主腦啦 114.27.184.211 04/05 18:15

12^F：推 yenchieh1102: 推 101.10.0.87 04/05 18:15

13^F：→ ZMTL: 負責資料收集、文件翻譯、知識歸納都很有用 114.27.184.211 04/05 18:15

14^F：→ ZMTL: 上面這些工作讓Cluade來跑才真的浪費 114.27.184.211 04/05 18:16

15^F：推 kaj1983: 感謝分享配備，看來cpu不用買太好也能跑 218.166.17.234 04/05 18:21

16^F：推 Rollnmeow: 不知有沒有勇者嘗試雙ARC B70的 49.216.252.165 04/05 18:32

17^F：→ EBVirus: 想請問你的結論這幾個模型哪個比較好用 36.239.20.247 04/05 18:34

18^F：→ EBVirus: ？ Gemma 4 31b還是qwen3.5 27b還是35b? 36.239.20.247 04/05 18:34

可以參考AI板文章 https://webptt.com/m.aspx?n=bbs/AI_Art/M.1772731938.A.221.html https://webptt.com/m.aspx?n=bbs/AI_Art/M.1775187123.A.6FB.html 快速結論：要推理：雲端超級模型 eg.Opus 4.6 > GPT 5.4 > Gemini 3.1 Pro 地端苦工(翻譯、資料清洗)：Defense 模型 Gemma4 31B、 Qwen3.5 27B 地端高效(聊天、問題警報)：MoE 模型 Gemma4 26B-A4B、Qwen3.5 35B-A3B 中文需求：Qwen3.5 多模態任務：Gemma4

19^F：推 weiber82: 還是每個月花100美好了… 27.247.32.53 04/05 18:34

20^F：→ ZMTL: Gemma4我還沒事，我目前都跑Qwen 114.27.184.211 04/05 18:35

21^F：→ ZMTL: 然後Claude我每個月是訂200$，100$都不夠用 114.27.184.211 04/05 18:35

22^F：→ ZMTL: 不過Claude這幾天才嚴令用Oauth串訂閱養蝦 114.27.184.211 04/05 18:36

23^F：→ ZMTL: 你要養蝦還是要評估怎麼節流 114.27.184.211 04/05 18:36

24^F：推 saito2190: 兩張卡應該是vLLM para開2去跑了吧 1.161.179.230 04/05 18:38

25^F：→ saito2190: 都玩到這樣了總不會還在用ollama... 1.161.179.230 04/05 18:38

26^F：→ saito2190: 不知道Qwen3.5 Tool Call的Bug修好了 1.161.179.230 04/05 18:39

27^F：→ saito2190: 沒 1.161.179.230 04/05 18:39

誠實來說，我組完雙卡就回家過清明了，還在研究怎麼跑雙卡比較實際，所以這篇基本上是提供硬體上的心得XD ※ 編輯: ZMTL (114.27.184.211 臺灣), 04/05/2026 18:53:06

28^F：推 YCL13: Qwen3.5雖然很強，但使用上真問題一堆 1.161.159.4 04/05 18:51

29^F：推 jhjhs33504: 量化模型要Q8_K或Q8_K_L問題會少很多 36.228.11.93 04/05 19:01

30^F：推 jhjhs33504: 居然還有少數Q8_K_XL量化模型品質更好 36.228.11.93 04/05 19:05

31^F：推 YukihanaLami: 推我就是拉到旁邊站兩張卡疊加放 118.168.254.20 04/05 19:10

32^F：→ YukihanaLami: 置不適合我這溫度敏感黨 118.168.254.20 04/05 19:10

33^F：推 YCL13: 如果接受拉到旁邊站...其實用拆分卡就好， 1.161.159.4 04/05 19:19

34^F：→ YCL13: 不過原PO本來的卡有點低階不確定是否支援 1.161.159.4 04/05 19:19

35^F：→ YCL13: 本來的MB 1.161.159.4 04/05 19:20

36^F：→ crimsonmoon9: 3090有沒有考慮上nvlink 42.77.204.245 04/05 19:20

37^F：推 ack0011: 其實X570比較容易找到符合的，或是多花 123.241.15.208 04/05 19:53

38^F：→ ack0011: 一點找個TR4 X399就能隨便插，還能用相 123.241.15.208 04/05 19:53

39^F：→ ack0011: 對便宜的16G湊到128G 123.241.15.208 04/05 19:53

40^F：→ ZMTL: 對了我要請教一下，直立架+延長線到底能不能 114.27.184.211 04/05 19:58

41^F：→ ZMTL: 保留x8啊，硬體我真的很不懂XDDD 114.27.184.211 04/05 19:58

42^F：→ himekami: X570 proart我記得有x8/x8 111.83.25.151 04/05 20:06

43^F：推 bobbyac01: 直立架跟延長線本身目標就是跑PCIe X1 1.169.228.66 04/05 20:24

44^F：→ bobbyac01: 6 1.169.228.66 04/05 20:24

45^F：→ bobbyac01: 你要跑x8不會有太大問題 1.169.228.66 04/05 20:24

46^F：→ bobbyac01: 但是需要小心訊號不穩 1.169.228.66 04/05 20:24

47^F：→ bobbyac01: 有擔心的話可以考慮SFF系列的轉接卡 1.169.228.66 04/05 20:24

48^F：推 autopass: 3090 也要缺貨了嗎? 140.109.40.73 04/05 20:28

49^F：推 fu1vu03: 如果只是翻譯功能這幾天玩Gemma 4 E4B感 125.229.5.91 04/05 20:30

50^F：→ fu1vu03: 覺比gemma 3 27B還好用 125.229.5.91 04/05 20:30

51^F：推 jhjhs33504: Gemma 4 E4B還支援音訊 Qwen3.5有台語 36.228.11.93 04/05 20:34

52^F：推 d0178411: 前幾天才看到有人雙3090延長線燒毀樓主 111.71.212.155 04/05 20:36

53^F：→ d0178411: 要用好一點的延長線啊 111.71.212.155 04/05 20:36

54^F：推 hangtenboy: 看不懂還是給推 114.43.130.151 04/05 20:42

55^F：推 Rollnmeow: 原PO指的延長線是PCIE 我還沒聽過會燒 36.227.219.87 04/05 20:49

56^F：推 william456: https://i.ibb.co/HJ3LTcS/1.jpg 114.42.243.63 04/05 20:56

57^F：→ william456: https://i.ibb.co/r2zg0ZNP/1.jpg 114.42.243.63 04/05 20:56

58^F：推 william456: 有人燒過喔，不少個 114.42.243.63 04/05 20:57

59^F：→ ZMTL: 好用的延長線跟直立架有推薦嗎XD 114.27.184.211 04/05 20:59

60^F：推 jack2k: 以現在RAM/SSD金貴的程度，有這樣的需求， 114.45.25.190 04/05 21:01

61^F：→ jack2k: DGX Spark好像也不是不能考慮了? 114.45.25.190 04/05 21:01

62^F：→ Rollnmeow: 這有調查過原因嗎？我猜也是觸點問題 36.227.219.87 04/05 21:01

63^F：推 taobnug: 目前3090用oculink外接（pcie3.0x4）跑c 111.82.146.63 04/05 21:07

64^F：→ taobnug: omfyui和llm使用約一年，一切順暢。 111.82.146.63 04/05 21:07

65^F：推 william456: 沒去追蹤，不知道跟GN之前拍過的nz 114.42.243.63 04/05 21:43

66^F：→ william456: xt h1是不是同問題，但品牌都不同 114.42.243.63 04/05 21:43

67^F：推 Rollnmeow: 如果什麼牌子的線都有機會燒起來 36.227.219.87 04/05 21:50

68^F：→ Rollnmeow: 我看解法只剩在機殼裡放熱像儀了 36.227.219.87 04/05 21:50

69^F：推 lordmi: 我好奇nvlink在消費級系統裡面有多大幫助 36.229.66.36 04/05 22:33

70^F：→ lordmi: ，有機會跑一下比較w 36.229.66.36 04/05 22:33

71^F：→ ZMTL: 根據Claude的說法，有沒有Nvlink 跑LLM大概 101.8.89.246 04/05 22:39

72^F：→ ZMTL: 差10-15%，主要還是靠PCIE連通，但我不知道 101.8.89.246 04/05 22:39

73^F：→ ZMTL: 真的假的XD 101.8.89.246 04/05 22:39

74^F：推 Supasizeit: TP 跟NVLink好像可以一起上？203.204.195.174 04/05 23:05

75^F：→ Supasizeit: VLLM文件是寫可以203.204.195.174 04/05 23:06

76^F：推 ByPass128: 差30到50趴，之前看的實測 27.247.121.167 04/06 00:50

77^F：→ ByPass128: https://bit.ly/4e4jU9C 27.247.121.167 04/06 00:51

78^F：推 hsuallan: 翻譯可以試試translate-gemma 61.228.92.55 04/06 01:14

79^F：→ hsuallan: 自己本地跑起還行看VT直播夠用了 61.228.92.55 04/06 01:15

80^F：推 qwe753951: 我之前是用Mac studio 放桌上不會吵 114.38.67.135 04/06 03:12

81^F：→ qwe753951: mac那邊比較簡單，有多少錢買多少ram， 114.38.67.135 04/06 03:17

82^F：→ qwe753951: 一台不夠買兩台 114.38.67.135 04/06 03:17

83^F：推 michael4210: 3090要搞nvlink的話橋接器非常難買也106.107.176.151 04/06 05:06

84^F：→ michael4210: 不便宜，當初我也是想這樣玩但後來發106.107.176.151 04/06 05:06

85^F：→ michael4210: 現成本太高，最後只用一張3090106.107.176.151 04/06 05:06

86^F：推 blueballer: 看來現在就是AI分流的時代了，高難度 223.137.135.24 04/06 07:20

87^F：→ blueballer: 工作給各家最強的AI，簡單、機敏的任 223.137.135.24 04/06 07:20

88^F：→ blueballer: 務交給本地模型，不然龍蝦token用量 223.137.135.24 04/06 07:21

89^F：→ blueballer: 太大了，不過想問原po任務分配給哪個 223.137.135.24 04/06 07:21

90^F：→ blueballer: 模型龍蝦能自己判斷嗎？還是下指令前 223.137.135.24 04/06 07:21

91^F：→ blueballer: 要註明？ 223.137.135.24 04/06 07:21

92^F：推 uly: 推薦 https://sql-benchmark.nicklothian.com 112.71.133.53 04/06 07:59

93^F：→ uly: 這網站來測試你本地的模型很好玩看能否上23 112.71.133.53 04/06 08:00

94^F：推 uly: 我自己的判斷是 token gen>50/s sql分>21 112.71.133.53 04/06 08:10

95^F：→ uly: 才算是日常寫程式可用 112.71.133.53 04/06 08:10

96^F：推 uly: 我只有3080TI12GB 用Qwen35 35B也能到70/s 23 112.71.133.53 04/06 08:24

97^F：推 uly: 某些9B蒸餾版本有16分的跑在8G卡簡單task能用 112.71.133.53 04/06 08:28

98^F：推 meloxxl: 12G也能跑35b嗎我問AI他說會卡成狗建 123.192.184.46 04/06 11:57

99^F：→ meloxxl: 議要有24g以上樓上大大的35b模型有壓縮 123.192.184.46 04/06 11:57

100^F：→ meloxxl: 嗎 https://i.verb.tw/OltQnlyb.jpg 123.192.184.46 04/06 11:57

101^F：→ crimsonmoon9: Q4大概18GB Q3或Q2可能塞得下吧 42.77.204.245 04/06 12:04

102^F：→ crimsonmoon9: 日常使用可以選低參數量的寫程式才 42.77.204.245 04/06 12:07

103^F：→ crimsonmoon9: 比較需要高參數量加上低精度 42.77.204.245 04/06 12:07

104^F：推 uly: Qwen3.5 35B A3B MOE架構12G可跑 27B卡成狗 112.71.133.53 04/06 12:41

105^F：→ uly: 12GB卡都會用Q4左右量化 112.71.133.53 04/06 12:42

106^F：推 necrophagist: Moe架構比dense快很多即使檔案較 111.81.34.139 04/06 12:50

107^F：→ necrophagist: 大offload到ram的部分更多也一樣 111.81.34.139 04/06 12:50

108^F：→ necrophagist: 但dense模型真的就是比較聰明 111.81.34.139 04/06 12:51

109^F：推 YCL13: 簡單來說，多數的AI在回答問題時都沒把MOE 59.115.163.173 04/06 13:05

110^F：→ YCL13: 放在答案裡，才會說出offload就是慢這種話 59.115.163.173 04/06 13:05

111^F：→ YCL13: ，像記憶體和CPU沒影響說法也是這麼來的 59.115.163.173 04/06 13:05

112^F：→ crimsonmoon9: MoE通常都比較快啊只是跟同量級模 42.77.204.245 04/06 13:07

113^F：→ crimsonmoon9: 型比active的參數比較少所以沒那麼 42.77.204.245 04/06 13:07

114^F：→ crimsonmoon9: 聰明比較像知識廣但是不深 42.77.204.245 04/06 13:07

115^F：→ crimsonmoon9: 如果整個模型可以全塞進VRAM裡幾乎 42.77.204.245 04/06 13:08

116^F：→ crimsonmoon9: 可以說沒有影響是沒錯 42.77.204.245 04/06 13:08

117^F：推 YCL13: MOE換取速度的代價就是樓上說的聰明，不過 59.115.163.173 04/06 13:10

118^F：→ YCL13: 模型的能力一直在提升，我就覺得gemma4 26B 59.115.163.173 04/06 13:10

119^F：→ YCL13: A4B非常接近Qwen3.5 27B 59.115.163.173 04/06 13:10

120^F：推 Rightclick: 很想把Lab兩張3090組起來，但教授說沒 39.12.138.153 04/06 13:56

121^F：→ Rightclick: 有雙x16損耗太大拒絕了.. 39.12.138.153 04/06 13:56

122^F：→ crimsonmoon9: 找一台epyc就有一堆x16了(x 42.77.204.245 04/06 14:03

123^F：→ linlun0807: 我也在考慮這套組合抑或是要衝6000pr 125.228.86.78 04/06 14:54

124^F：→ linlun0807: o 125.228.86.78 04/06 14:54

125^F：推 pxhome: 3090原生不支援FP8，只能INT8或者FP16， 36.230.188.35 04/06 15:30

126^F：→ pxhome: 24GB只是好看而已 36.230.188.35 04/06 15:30

127^F：推 pxhome: 只有Hopper以後的TensorCore才支持FP8 36.230.188.35 04/06 15:33

128^F：→ pxhome: 首選4090的，或者24GB的MAC M4 36.230.188.35 04/06 15:34

129^F：推 pxhome: Intel ARC B60/B70算力太低不適合跑AI 36.230.188.35 04/06 15:36

130^F：→ pxhome: 30B量化至少要16GB，再往上70B首選是4090 36.230.188.35 04/06 15:37

131^F：→ pxhome: 24GB 36.230.188.35 04/06 15:37

132^F：推 pxhome: 會推MAC是因為GPU&CPU統一記憶體架構，24G 36.230.188.35 04/06 15:40

133^F：→ pxhome: B 250GB/s的頻寬相當於GDDR5 256Bit跑30B 36.230.188.35 04/06 15:40

134^F：→ pxhome: 還夠用 36.230.188.35 04/06 15:40

135^F：→ pxhome: MAC MINI M4 PRO 36.230.188.35 04/06 15:42

136^F：→ pxhome: gemma-4-31B-it 4Bit量化，VRAM佔用量， 36.230.188.35 04/06 15:50

137^F：→ pxhome: 最大19GB 36.230.188.35 04/06 15:50

138^F：→ pxhome: 如果你的口袋夠深可以拿64GB 36.230.188.35 04/06 15:52

139^F：推 pxhome: M4 MAX 536GB /s 相當於256Bit GDDR6 ， 6 36.230.188.35 04/06 16:06

140^F：→ pxhome: 4GB跑 70B 4Bit量化很流暢，重點價格還比3 36.230.188.35 04/06 16:06

141^F：→ pxhome: 2GB的5090單卡便宜一些，也不用擔心那個 36.230.188.35 04/06 16:06

142^F：→ pxhome: 該死的12pin燒卡 36.230.188.35 04/06 16:06

143^F：→ pxhome: MAC Studio 36.230.188.35 04/06 16:07

144^F：→ pxhome: 如果模型有支援MLX，比如說Gemma 3N， 36.230.188.35 04/06 16:14

145^F：→ pxhome: 可以改用Apple Silicon 16核心NPU來做數 36.230.188.35 04/06 16:14

146^F：→ pxhome: 學推論，作同樣的一件事性能提高了3倍，功 36.230.188.35 04/06 16:14

147^F：→ pxhome: 耗只有1/10，這是NV GPU的弱點 36.230.188.35 04/06 16:14

148^F：推 newyorker54: 剛剛測本地gemma 4 , score 21 36.237.178.163 04/06 16:20

149^F：→ newyorker54: http://i.imgur.com/rpGSuyC.jpg 36.237.178.163 04/06 16:20

150^F：推 jhjhs33504: 4Bit量化首選gpt-oss其他品質損耗太大 36.228.11.93 04/06 16:24

151^F：推 jhjhs33504: 模型回覆的品質體感難以單一指標評估 36.228.11.93 04/06 16:27

152^F：→ jhjhs33504: 跑分通常是快慢很多模型問多容易跑題 36.228.11.93 04/06 16:30

153^F：推 scarbywind: 有測試影片說m5比m4快一倍 39.14.32.88 04/06 18:04

154^F：→ necrophagist: 發現前面推文圖的ai也太多幻覺了吧 111.81.34.139 04/06 18:13

155^F：→ necrophagist: 笑死xd qwen3.5 7b/14b根本不存在 111.81.34.139 04/06 18:13

156^F：→ necrophagist: 的模型叫它更新確認網路資料再比 111.81.34.139 04/06 18:13

157^F：→ necrophagist: 啦 111.81.34.139 04/06 18:13

158^F：推 jhjhs33504: 可惜速度快的gpt-oss不具圖像辨識能力 36.228.11.93 04/06 18:26

159^F：推 newyorker54: 自己用qwen3.5-27b測score 23, 幹掉k 36.237.178.163 04/06 18:27

160^F：→ newyorker54: imi k2.5 , 對標qwen3.6 plus 36.237.178.163 04/06 18:27

161^F：→ newyorker54: 幹掉glm 5, 這是真的嗎？ 36.237.178.163 04/06 18:27

162^F：→ newyorker54: 還比 gpt 5.4高我是不太相信這個數據 36.237.178.163 04/06 18:28

163^F：→ newyorker54: http://i.imgur.com/pXGWNBB.jpg 36.237.178.163 04/06 18:29

164^F：推 uly: 各個benchmark有其觀察面向SQL看的是tooling 112.71.133.53 04/06 21:12

165^F：→ uly: 比如說長上下文能力在這個SQL就看不出來 112.71.133.53 04/06 21:13

166^F：推 uly: Qwen3.5 27B可能在這種單SQL場景正確性高 112.71.133.53 04/06 21:17

167^F：推 Esvent: 最近剛好在玩 5090+3090(x4) 效果還不錯223.137.179.211 04/07 08:51

168^F：→ Esvent:223.137.179.211 04/07 08:51

169^F：→ Esvent: magnum 72b q4_k_ml 速度超快品質還算可223.137.179.211 04/07 08:51

170^F：→ Esvent: 以223.137.179.211 04/07 08:51

171^F：→ Esvent: magnum 123b iq3_xxs 速度慢一些但更聰223.137.179.211 04/07 08:51

172^F：→ Esvent: 明223.137.179.211 04/07 08:51

173^F：→ Esvent: 不過期間把OS搞壞幾次後來發現是ddr5 e223.137.179.211 04/07 08:51

174^F：→ Esvent: xpo 還有主機板ai 超頻的問題關掉就穩了223.137.179.211 04/07 08:51

175^F：推 w1222067: x8 x8 主機板不少阿 36.233.68.24 04/07 10:30

176^F：→ ZMTL: 不確定是不是因為我不想換CPU，還是該連CPU 60.250.61.214 04/07 11:19

177^F：→ ZMTL: 都一起換掉 60.250.61.214 04/07 11:19

178^F：→ ZMTL: 1700腳位的真的少 60.250.61.214 04/07 11:19

179^F：推 yymeow: AM5或1851的x8/x8板子選擇就不少 60.250.130.216 04/07 11:58

180^F：推 newyorker54: 不具圖像辨識能力，可以用mcp調用工120.114.249.100 04/07 15:13

181^F：→ newyorker54: 具，像minimax m2.5可以mcp調用工具120.114.249.100 04/07 15:13

182^F：→ newyorker54: 就可以圖像辨識，ocr, 生成影片120.114.249.100 04/07 15:13

183^F：→ newyorker54: 我有實做過，但是mcp 呼叫有被其他模120.114.249.100 04/07 15:16

184^F：→ newyorker54: 型改寫過，造成語法不合，現在還在想120.114.249.100 04/07 15:16

185^F：→ newyorker54: 辦法復原120.114.249.100 04/07 15:16

186^F：推 basterds: 想組台來看youtube和玩麥塊 223.139.193.4 04/07 16:57

187^F：→ RaiGend0519: 看一看電腦裡的3080 1.168.0.50 04/07 23:59

188^F：→ RaiGend0519: 還是看大神們怎麼玩吧QwQ 1.168.0.50 04/07 23:59

189^F：推 maurice20097: 48gb可以用Gemma 4 31b fp8的版本 125.227.199.49 04/08 13:17

190^F：→ maurice20097: ，跑起來蠻順的 125.227.199.49 04/08 13:17

191^F：推 Nitricacid: 現在訂閱流量都玩不透明的計算...早 101.10.13.29 04/08 23:42

192^F：→ Nitricacid: 晚都是要自幹的不然等著被養套殺 101.10.13.29 04/08 23:42

193^F：→ lordmi: 本地小模型現在就能當玩具沒有生產力，等114.136.240.199 04/09 09:46

194^F：→ lordmi: 共通記憶體128白菜價的時候再談自幹吧114.136.240.199 04/09 09:46

195^F：→ lordmi: 補充這句只限個人領域。商用的話不管多少114.136.240.199 04/09 09:48

196^F：→ lordmi: 錢都是洗下去，太多機密資料要本地弄了114.136.240.199 04/09 09:48

197^F：推 AlfaCEcho: 推 42.77.22.192 04/09 21:07

198^F：→ bearq258: gx10 買下去可以用很久，二手也有要 42.78.40.161 05/14 08:13

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

PC_Shopping 板

Fw: [閒聊] RTX3090 單/雙卡本地LLM運算AI電腦心得

熱門看板

贊助商連結