作者waitrop (嘴砲無雙)
看板PC_Shopping
標題Re: [開箱] ASUS Ascent GX10 開箱文
時間Mon Jun 8 07:45:13 2026
※ 引述《waitrop (嘴砲無雙)》之銘言:
: ASUS Ascent GX10, 2TB
: 到 asus 美國官網買的,
: 原本想買 mac studio m5 256gb,
: 但是缺貨延後到年底發行,
: 而且我覺得很可能會因應記憶體短缺跟聖誕行情,
: 而把記憶體跟CPU先挪給手機跟筆電,
: 所以我等到都懷疑今年不會有mac studio 256gb,
: 甚至明年都不見得會上市
: 所以這台GB10 是全世界市場上唯一能跑本地大模型的家機,
: 所以我就買了這台, 在他變缺貨之前,
: 而且這台也比mac studio 便宜,
: 當然,
: 貴不是他的問題, 是我的問題
: 正版開箱文,
: 就三張圖, 真的開箱插電就結束了,
: https://imgur.com/orCpvIJ
: https://imgur.com/CZnNfHw
: https://imgur.com/rLYXacD
: 剩下來的都是軟體安裝操作寫程式等等的事情,
: 下面再開另外一篇繼續接著說安裝操作跟debug的部分,
: 這部分才是最痛苦的地方
: 什麼? 你要看的開箱文開箱圖不是這些?
: 我懂了,
: 現在流行 AI 示意圖,
: 那我就給幾張 ASUS Ascent GX10 開箱 示意圖,
: 就是用這台ASUS Ascent GX10 搭配不同模型畫出來的示意圖
: Z-Image-Turbo: 12G, z-image-turbo-BF16.gguf
: https://imgur.com/nwHPMoY
: https://imgur.com/NAiuHbW
: Flux1.0: 23G, flux1-dev.safetensors
: https://imgur.com/1IwDK7t
: AuraFlow (v0.3): 16G, aura_flow_0.3.safetensors
: https://imgur.com/iFFFD7P
原本不想再寫"軟體安裝操作"這段,
因為這段很煩也很痛苦,
再寫一次就是在折磨一次,
但是看到大家的推文,
我覺得我需要出來推廣一下 Linux and MacOS,
這個AI 時代,
你必須擁抱 Linux and MacOS,
其實作業系統現在都長得差不多,
真的不需要一定要綁在Windows,
我從大學開始,
必須適應各種作業系統工作,
最誇張的一次是要求我用Chromebook 寫程式,
這段黑歷史就不多說了,
沒關係沒背景的社畜,
是連電腦跟作業系統的選擇權都沒有
回到AI 開發與應用環境,
強烈建議使用Gemini + Nvidia GPU (CUDA) + Linux or MacOS,
因為所有的問題跟答案都可以問Gemini,
我這次所有的AI 開發環境以及side project,
全都是問Gemini 得到答案,
十年前我自學DeepLearning 跟 CUDA的時候,
必須自己去爬討論區文章,
還有數千頁的技術文件,
遇到沒有解答,
還要自己寫程式patch
現在情況好多了,
不需要去爬討論區問大神,
也不需要讀數千頁技術文件,
直接問Gemini, 還能貼圖問問題,
然後Linux and MacOS 的opensource 環境也好多了,
幾乎所有的solution 都有 opensource,
你只要一路pip install, apt install,
就完成了
現在幾乎所有的AI ML solution,
都是架構在CUDA, Linux MacOS opensource,
如果你選擇ROCm+Windows,
你會遇到非常多問題而且無解,
甚至要跟我十年前一樣, 自己寫patch之類的,
回到這台ASUS Ascent GX10 軟體安裝的部分,
好處是大部分的驅動程式跟工具都已經裝上了,
Ollama 直接 pip install 就能用,
這邊遇到兩個問題:
1. Container support:
原本Gemini 要炫技,
要用container 跑ollama,
結果被打臉,
container 認不出GB10 GPU, 沒有driver,
只能使用本機預設安裝的driver,
跑 ollama 在本機上,
這是perf output,
可以看到模型完全跑在CPU上面, GPU的loading 0
https://imgur.com/nBzMKFO
2. Ollama 大模型記憶體的額外設定,
Ollama 預設沒想過會有VRAM超過72GB,
所以Ollama 預設最高只能塞進去72GBVRAM 給 GB10 GPU,
所以會看到GPU跑起來, CPU loading 也降下來,
但是perf 卡在memory swapping,
https://imgur.com/hfe4sVB
https://imgur.com/ZhP4pFp
把Ollama 的VRAM 打開到最大,
可以看到GB10 VRAM 跑到83GB, GPU 使用率到96%, 穩了!
https://imgur.com/yCX0fK2
CPU 也降下來了
https://imgur.com/Ede5K8C
有了 Ollama,
我可以跑Qwen2.5-72B 大模型,
當個起點網文小說家,
有文章之後, 當然就要有圖,
一樣問Gemini,
安裝ComfyUI 一路pip install, 就做完了,
但是這裡又遇到一些問題:
1. Pytorch 認不得GB10
https://imgur.com/MoOT7hx
https://imgur.com/3ojtoH3
2. 解決方法,
下載最新的nvidia container,
裡頭有最新的gb10 driver,
然後再從這個nvidia container 裡頭把pytorch 刪掉重新編譯,
之後ComfyUI就跑起來了,
下載我前面說的那三個畫圖模型,
問Gemini 怎麼佈置ComfyUI 畫布,
然後小鎮小畫家就完成了
下一步, 我正在建立小鎮射癮師 跟 小鎮AV導演,
完成了之後有空再來分享
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.103.225.6 (美國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/PC_Shopping/M.1780875915.A.E94.html
1F:→ sinclaireche: 現在無腦裝應用是會被供應鏈攻擊的 112.104.98.169 06/08 07:51
2F:→ crimsonmoon9: GB10沒有新到image沒driver吧 223.139.112.30 06/08 08:00
3F:推 saito2190: 你的container run time沒有改成NV吧 1.161.160.164 06/08 08:03
真的沒有,
我抓的是ollama的container, 真的沒有支援gb10
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 08:04:53
4F:→ saito2190: 雖然ollama快速開箱就能用,但是你會 1.161.160.164 06/08 08:04
5F:→ saito2190: 發現他其實超級難用,一堆設定都不能 1.161.160.164 06/08 08:04
6F:→ saito2190: 調,建議儘早改用vllm或llama.cpp 1.161.160.164 06/08 08:04
7F:→ crimsonmoon9: 由於我要打瓦所以GB10被我丟進機櫃 223.139.112.30 06/08 08:05
8F:→ crimsonmoon9: 只用來開endpoint在Windows上用 223.139.112.30 06/08 08:05
9F:→ crimsonmoon9: 結論 萬惡拳頭 223.139.112.30 06/08 08:05
10F:→ crimsonmoon9: 容器需要額外裝ctk 可能缺這個 223.139.112.30 06/08 08:06
11F:推 saito2190: 如果原PO比較懶得調參數,有個網站可 1.161.160.164 06/08 08:09
12F:→ saito2190: 以直接抄 spark-arena.com 裡面都是fo 1.161.160.164 06/08 08:09
13F:→ saito2190: r GB10能直接抄了去用的RECIPE 1.161.160.164 06/08 08:09
14F:→ saito2190: 單人Agent使用我推Qwen3.5 122B NVFP4 1.161.160.164 06/08 08:09
15F:→ saito2190: 多人的話就3.6 35B FP8或NVFP4都行 1.161.160.164 06/08 08:09
16F:推 L4D3: 裝wsl就好了啊 223.141.61.145 06/08 08:15
17F:→ sinclaireche: 遠離Windows 11 104.28.160.169 06/08 08:28
18F:→ sinclaireche: ollama 不實用 104.28.160.169 06/08 08:29
19F:→ pc0805: 聽人家說ollama很爛的樣子,用llama.cpp 223.136.72.24 06/08 08:44
20F:→ pc0805: 比較好 223.136.72.24 06/08 08:44
21F:推 SHR4587: 一般人去用Linux只會幹幹叫而已==111.248.116.162 06/08 08:50
22F:→ SHR4587: 說沒差很多是因為你有相關知識可以很輕鬆111.248.116.162 06/08 08:50
23F:→ SHR4587: 上手,不要說電腦小白,沒有程式背景111.248.116.162 06/08 08:51
24F:→ SHR4587: 的去用學習成本會滿高的111.248.116.162 06/08 08:51
25F:→ SHR4587: 至於你說AI時代也不是所有人有需求去部屬111.248.116.162 06/08 08:52
26F:→ SHR4587: 本機LLM吧,有這個需求當然會自己去找111.248.116.162 06/08 08:52
27F:→ SHR4587: Linux跟MacOS111.248.116.162 06/08 08:52
28F:推 sdbb: Tpu:為何不用自己親生的? 111.251.69.106 06/08 08:56
又不對外賣, 我在家做side project沒有tpu可以用,
得過兩次tech impact awards,
公司送我兩張tpu 卡當成獎牌,
但是我很懷疑這兩張可能無法開機,
我不想讓家裡爆炸起火
29F:→ spfy: ollama優點就就是裝了即用吧 但也就這樣 114.136.78.254 06/08 08:59
30F:推 s78513221: 我覺得是Token成本跟審查的問題 111.71.100.198 06/08 09:03
31F:→ s78513221: 如果用到超出現有訂閱制的上限或邊界 111.71.100.198 06/08 09:03
32F:→ s78513221: 那麼本機LLM就有他的必要性了 111.71.100.198 06/08 09:03
33F:推 eddy13: 你都建議大家要用Linux了,怎麼還會想用o114.137.107.127 06/08 09:06
34F:→ eddy13: llama呀?114.137.107.127 06/08 09:06
35F:→ sinclaireche: 投入成本跑雲端同級模型可以好幾年 104.28.159.154 06/08 09:28
36F:→ sinclaireche: 只有要繞過安全性邊界或機密的需求 104.28.159.154 06/08 09:29
37F:→ sinclaireche: Token 成本是不會比雲端便宜的 104.28.159.154 06/08 09:30
我的gemini api toke 一個月三四百塊美金,
這都已經是我最保守最便宜的用法,
我沒搞tokenmaxx 那套,
我非常非常省著用token,
微軟語音一個月$50美金,
最貴的是kling 動畫製作,
一個月要兩百塊以上,
只是平均每天三分鐘的動畫製作而已
加起來一個月五百塊token費用,
所以本地LLM 省一半的token 就划算了,
一個月省250美元, 很合理吧,
一年就省三千美金,
這台我準備用四五年以上,
更何況可以繞過安全邊界,
我的ptt 鬼故事短片一直被gemini 拒絕生成
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 09:34:59
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 09:39:44
38F:→ iceyang: 答應我 別做醬板鴨 61.224.172.211 06/08 09:47
39F:推 bizer: 要做醬板鴨這台會跑到睡著,哈 1.160.179.71 06/08 09:59
40F:噓 are2: rocm+windows好像沒有你麻煩喔 42.70.110.33 06/08 10:02
41F:→ are2: 看只搞個ollama就這樣多折騰了 42.70.110.33 06/08 10:03
42F:→ are2: 你目前裝這些離linux的精髓還差得遠 42.70.110.33 06/08 10:09
43F:推 newyorker54: 我一開始也是用ollama, 後來也是乖乖 140.116.98.195 06/08 10:12
44F:→ newyorker54: 投向llama.cpp 140.116.98.195 06/08 10:12
45F:→ newyorker54: 單人使用llama.cpp又比vllm好用 140.116.98.195 06/08 10:12
46F:推 amos30627: 我看厲害的都不用ollama欸 101.8.129.50 06/08 10:15
47F:→ amos30627: 我現在就是windows用ollama 雖裝即用 101.8.129.50 06/08 10:18
48F:→ amos30627: 超級簡單 101.8.129.50 06/08 10:18
這些都只是工具而已,
哪有什麼厲害不厲害的,
模型可能有影響,
其他連模型都稱不上的工具,
哪有什麼差別,
重點根本不是在這些工具上面,
只是一次安裝很煩
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 10:21:31
49F:→ soulgem: 買 DGX spark 那本書翻第一頁 ClaudeCode 140.112.30.184 06/08 10:21
50F:→ soulgem: 直接昏倒... 140.112.30.184 06/08 10:21
51F:推 sdbb: Tqqq の王要做的事,ollama 可能無法滿足 111.251.69.106 06/08 10:22
52F:→ soulgem: Windows用lmstudio,linux才走ollama。 140.112.30.184 06/08 10:22
53F:→ soulgem: 今天才開始跟 Hermes desktop 但也嚇到了 140.112.30.184 06/08 10:26
54F:噓 are2: windows用wsl2+doccker裝啥都行118.150.170.141 06/08 10:40
55F:→ are2: 但要用windows就別折騰本地AI了 OS太爛118.150.170.141 06/08 10:41
56F:推 CardLin: 我目前訂gpt-5.4-mini for Hermes Agent 111.243.9.138 06/08 10:53
57F:→ CardLin: 搭配訂閱 AntiGravity for Hermes Coding 111.243.9.138 06/08 10:54
58F:→ CardLin: Hermes 會自動呼叫 agy 命令去寫程式 111.243.9.138 06/08 10:55
59F:→ CardLin: 我想問原PO是甚麼因素不用訂閱的就好? 111.243.9.138 06/08 10:55
60F:→ CardLin: 除了鬼故事被禁止,訂多個平台也比較便宜 111.243.9.138 06/08 10:56
我已經說過原因了,
我一直都用訂閱的, 你搞錯了,
我的prototype 就是用我手上的七年舊筆電跟mac mini 做出來的,
用各個平台的token 訂閱,
我用gemini api 生成文字劇情故事,
還有用香蕉2.0 api畫圖,
用微軟語音生成聲音,
再用kling 把圖轉動畫,
全部訂閱沒有本地LLM,
一個月500美金,
原因就是想省一半的token 錢,
還有鬼故事被禁止到根本沒什麼鬼故事可以生成,
還有我想做ai 界的onlyfans
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:03:23
61F:推 CardLin: 另一個問題是GX10速度能媲美API的速度嗎? 111.243.9.138 06/08 11:01
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:03:59
62F:推 Shian1225: NV邊緣運算開發的從業人員路過,跟Jet 42.79.40.85 06/08 11:04
63F:→ Shian1225: son系列比,GB10的文件已經相對完善了 42.79.40.85 06/08 11:04
64F:→ Shian1225: ,只是AI的回答常會混用x86的解答,NV 42.79.40.85 06/08 11:04
65F:→ Shian1225: 有整理幾個常用LLM推理後端的應用流程 42.79.40.85 06/08 11:04
66F:→ Shian1225: ,桌面捷徑跟手冊裡應該都有連結: 42.79.40.85 06/08 11:04
68F:推 nrsair: 技術和AI 49.217.123.245 06/08 11:08
69F:推 CardLin: 謝謝回覆,那請問GX10速度會不會很慢,最 111.243.9.138 06/08 11:10
70F:→ CardLin: 終導致覺得速度太慢不好用?? 111.243.9.138 06/08 11:11
71F:→ CardLin: 我測過RTX4070TiS跑gpt-oss-20b就覺得慢 111.243.9.138 06/08 11:11
我把速度跟效能方面說清楚:
1. Gemini 最快, 無敵快,
生成文章大概幾秒,
生圖甚至不到一秒
2. 本地ollama 生成文章慢,
跟模型大小有關,
同樣文章大小, Gemini 幾秒鐘,
qwen3.6-35B local 十幾分鐘,
qwen2.5-72B local 三十幾分鐘, 偶而還會timeout
3. 本地ComfyUI 生成圖:
一張圖大概一分鐘上下
但是, 就是這個但是,
整個流程最花時間的不是這部分,
最花時間的是影片部分,
kling 一個影片request大概3-5秒的影片長度,
但是需要2-5分鐘,
所以生成3分鐘的短片,
kling 需要一小時左右的生成時間,
會生成30-60的小檔案mp4,
然後再把這些小檔案串成一個三分鐘的mp4檔案
如果不走kling流程,
像鬼故事都被kling拒絕,
只能走靜態圖片流程,
就是你常在youtube看到的長輩圖轉成長輩影片那種類型,
這個又是幾小時起跳的生成時間,
所以整個效能的問題是卡在影片生成部分,
當然這跟我的煉丹爐太老舊有關,
原本想買mac studio 256gb 就是想可以順便解決生成影片的問題
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:28:50
72F:→ sinclaireche: 模型等級差那麼多也要直接這樣比? 101.12.129.223 06/08 11:31
73F:推 newyorker54: reddit 有人說mac studio更慢 140.116.98.195 06/08 11:31
74F:→ sinclaireche: 生圖和影片是GB10快 101.12.129.223 06/08 11:33
75F:→ sinclaireche: 最佳化的部分原Po可以多花點時間 101.12.129.223 06/08 11:34
76F:→ sinclaireche: 懶得設定不要用本地 101.12.129.223 06/08 11:34
77F:→ newyorker54: 生成文章一般都是一到兩分鐘,會不會 140.116.98.195 06/08 11:35
78F:→ newyorker54: 是設定的問題,建議改llama-server 140.116.98.195 06/08 11:35
79F:→ newyorker54: 啟動,只要參數設好當成模板,每次啟 140.116.98.195 06/08 11:35
80F:→ newyorker54: 動就是複製貼上不會太麻煩 140.116.98.195 06/08 11:35
81F:推 CardLin: 我之前電腦跑過 ollama 是覺得異常的慢 111.243.9.138 06/08 11:36
82F:→ CardLin: 原PO可以測一下 llama.cpp 或 vLLM 111.243.9.138 06/08 11:38
83F:→ newyorker54: 生成文章十幾分鐘真的太慢35B大小的 140.116.98.195 06/08 11:38
84F:→ newyorker54: 模型吃不了128gb那麼多,記憶體綽綽 140.116.98.195 06/08 11:39
85F:→ newyorker54: 有餘,理論上純文字用不到兩分鐘,用 140.116.98.195 06/08 11:39
86F:→ newyorker54: Hermes cli速度更快功能也更完整 140.116.98.195 06/08 11:39
87F:→ sinclaireche: 會這麼慢通常是只用到cpu 104.28.156.240 06/08 11:39
我有空再來試試其他的工具像是llama.cpp 或 vLLM,
但是這真的不是我的流程最花時間的一塊,
其實沒那麼嚴重,
最花時間的是生成影片
我一般thinking 就要花3-5分鐘,
然後每秒鐘生成10-15個中文字,
2500個中文字數的文章大概需要花3-5分鐘,
這是用qwen3.6-35B去估算
cpu 更慢, 我可以感覺出來,
一開始跑沒有跑在GPU上面的時候,
一秒鐘大概1-5個中文字
88F:→ newyorker54: GB10是套裝機環境相對單純,Llama, 140.116.98.195 06/08 11:41
89F:→ newyorker54: 或vllm都不會太難 140.116.98.195 06/08 11:41
90F:→ newyorker54: @sinclaireche 我也是這麼覺得 140.116.98.195 06/08 11:41
91F:→ sinclaireche: 雲端旗艦模型的速度跟品質都大勝 104.28.156.240 06/08 11:44
92F:→ sinclaireche: 價格沒差很多 104.28.156.240 06/08 11:44
93F:→ sinclaireche: 一台GB10能跑的模型遠比雲端同等級 104.28.156.240 06/08 11:44
94F:→ sinclaireche: 模型價格貴 104.28.156.240 06/08 11:44
95F:→ crimsonmoon9: 雲端本地各有各的好 但是如果目的是 223.139.158.54 06/08 11:45
96F:→ crimsonmoon9: 想改用本地省訂閱費那是不划算沒錯 223.139.158.54 06/08 11:45
的確雲端模型的速度跟品質都大勝GB10,
但是我不在乎速度,
我的掛機agent 根本不在乎速度,
真正的速度瓶頸也不是在這些地方,
是在影片生成那部分
所以如果我願意用時間速度去換取省下來的錢,
那就划算了,
我現在的做法是: 重點部位用雲端模型,
不重要的地方,
用本地LLM 慢慢生成,
品質差點沒關係,
你片子會從頭看到尾嗎?
還不都是拉一拉, 看重點幾分鐘而已
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:53:01
97F:推 eddy13: 慢成這樣一定有問題114.137.107.127 06/08 11:53
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:57:07
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 11:58:39
98F:→ sinclaireche: 產影片要快不如買一張好一點的卡 104.28.156.240 06/08 12:00
99F:→ sinclaireche: 這台優點是RAM 104.28.156.240 06/08 12:00
100F:→ sinclaireche: 除了RAM大以外 速度很慘 104.28.156.240 06/08 12:00
101F:→ YouCantGetME: 如果沒AWS跟Jetson墊好幾年arm基礎 125.228.92.1 06/08 12:05
102F:→ YouCantGetME: 大概要多一年到現在的"堪用"程度 125.228.92.1 06/08 12:07
103F:推 yenchieh1102: 坐等導演 49.216.48.150 06/08 12:11
104F:推 CardLin: 蠻想看GB10的影片成品可以作到怎樣的程度 111.243.9.138 06/08 12:22
105F:→ saito2190: 要說速度肯定是跑不快,GB10用LPDDR5x114.137.164.229 06/08 12:55
106F:→ saito2190: 頻寬完全比不上GDDR7,Qwen 3.6 35B-A114.137.164.229 06/08 12:55
107F:→ saito2190: 3B的模型我自己調到最快大概66 token/114.137.164.229 06/08 12:55
108F:→ saito2190: s (單request)114.137.164.229 06/08 12:55
109F:→ saito2190: 如果你影片生成的時候ollama沒關掉,114.137.164.229 06/08 12:57
110F:→ saito2190: 那有可能是慢在uni-RAM爆掉,然後一直114.137.164.229 06/08 12:57
111F:→ saito2190: 跟硬碟SWAP的結果,這台是統一記憶體114.137.164.229 06/08 12:57
112F:→ saito2190: ,特別容易爆掉114.137.164.229 06/08 12:57
113F:→ ganei: 這東西記憶體頻寬只有兩百多,不用想像得太 42.79.148.56 06/08 13:16
114F:→ ganei: 美好,重點是能跑,沒了。真的要懶乾脆用LM 42.79.148.56 06/08 13:16
115F:→ ganei: studio 算了,還能無痛接Claude code讓你 42.79.148.56 06/08 13:16
116F:→ ganei: 享受本地端狂燒token 的快感 42.79.148.56 06/08 13:16
我前面已經說了,
影片生成有兩個部分,
AI 的 i2v 生成是靠kling API, 跟GPU 無關,
一個request 3-5秒需要3-5分鐘,
靜態圖片轉影片是靠七年舊的 mac mini 用ffmpeg 去轉
所以跟GB10 完全無關,
我現在正在做的事情就是想把kling API 那塊轉到本地的GB10 i2v 生成,
慢沒關係,
因為kling 已經夠慢,
我的mac mini ffmpeg 也慢到哭爸
※ 編輯: waitrop (76.103.225.6 美國), 06/08/2026 13:25:00
117F:→ pomar222: 如果要用wan之類的生影片,建議要去優 182.233.123.35 06/08 14:12
118F:→ pomar222: 化記憶體路徑,統一記憶體PyTorch沒有優 182.233.123.35 06/08 14:12
119F:→ pomar222: 化,會浪費不少時間 182.233.123.35 06/08 14:12
120F:推 bizer: Gb10好玩的是可以玩cluster去搞各種優化, 114.137.216.53 06/08 15:35
121F:→ bizer: 某些情況多台台Gb10能比得上rtx6000 pro, 114.137.216.53 06/08 15:35
122F:→ bizer: 但對某些人來說不是玩而是被搞 114.137.216.53 06/08 15:35
123F:推 pomar222: 是啊尤其是那個connect x7配nccl到處玩 182.233.123.35 06/08 17:33
124F:→ pomar222: ,效率暴漲 182.233.123.35 06/08 17:33
125F:推 yymeow: GX10不用switch的話最多就是三台堆疊 60.250.130.216 06/08 18:03
126F:→ yymeow: 更多台就要張羅QSFP 400Gb的swicth,那東 60.250.130.216 06/08 18:09
127F:→ yymeow: 西可不便宜 60.250.130.216 06/08 18:09
128F:→ bbsman: Llama.cpp真的好用 114.140.89.68 06/08 18:17
129F:推 alvinlin: 沒人關注美女圖180.177.212.126 06/08 18:34
130F:→ spfy: 因為這裡是電瞎 便宜的記憶體和顯卡比正妹 114.136.78.254 06/08 18:59
131F:→ spfy: 圖更能引起注意 114.136.78.254 06/08 18:59
132F:推 pomar222: 至於推論疊多機需要自己debug,官方跟廢 101.10.246.35 06/08 19:37
133F:→ pomar222: 物一樣,要靠社群跟自己打patch,目前四 101.10.246.35 06/08 19:37
134F:→ pomar222: 台tp推論能動了 101.10.246.35 06/08 19:37
135F:→ sachialanlus: 關鍵字 ollama 124.9.0.218 06/08 20:08
136F:推 birdc: pomar大,4台stacking是串成ring嗎? 122.116.228.38 06/09 00:09
137F:推 pomar222: 串成ring,tree没成功过,跟codex好好磨 182.233.123.35 06/09 00:13
138F:→ pomar222: ,迟早绕出来 182.233.123.35 06/09 00:13
139F:推 stlinman: 推薦用lama.cpp更新比較快啊!150.116.129.113 06/09 13:07
140F:推 stlinman: 另外推薦,PTT 有 AI_Art 可以討論150.116.129.113 06/09 13:14
141F:推 pomar222: 不知道是不是標錯價gx10 gb10這台補貨1t 182.233.123.35 06/09 21:49
142F:→ pomar222: b版本在pchome已經到175900了 182.233.123.35 06/09 21:49
143F:→ slein: 感覺是真的漲價,之前聽到代理商說要調漲 59.115.155.59 06/09 23:23
144F:→ slein: ,但應該是七月後,六月維持售價但不補貨 59.115.155.59 06/09 23:23
145F:→ slein: 。看來是之前的貨批都出完了 59.115.155.59 06/09 23:23
146F:→ waitrop: 我買2tb版,3999 104.133.198.40 06/10 00:55
147F:推 Baternest: 目前單台GB10能跑的最佳模型可以Google118.163.110.208 06/10 14:55
148F:→ Baternest: DGX_Spark_Qwen3.5-122B-A10B-AR-INT4118.163.110.208 06/10 14:55
149F:推 bizer: 本來要買機台的看到漲成這樣又縮了 1.160.179.71 06/11 20:42
150F:推 pomar222: 是啊,原本想說可以更穩定後,再買四台 182.233.123.35 06/11 21:12
151F:→ pomar222: ,現在笑死人了,等ai泡沫炸掉在入手好 182.233.123.35 06/11 21:12
152F:→ pomar222: 了 182.233.123.35 06/11 21:12