作者strlen (strlen)
看板Stock
標題Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
時間Sat Jan 25 17:37:24 2025
很多人看著benchmark多高多高吹滿天
如果你也是個老電腦玩家
就知道評測基本只能當參考
老黃前陣子在大會上拿出新的遊戲顯卡5070說對標4090
新玩家們個個目瞪口呆
老玩家們則是
https://i.imgur.com/Sxb1f15.jpeg
評測數據嚇死人
實跑遊戲笑死人
然後再來怪優化不佳
這種我們中老年都看多了
講那摸多
不用不用
實際動手玩
就知道惹
反正大過年的
閒著也是閒著
就來實地評測AI
也不用拿什麼多複雜難解的數學題
就拿前端碼農拿到設計圖要切版就好
最實際在工作上會用到
https://i.imgur.com/sLl860H.jpeg
這是網路上找到的一個簡單的註冊網頁設計圖
目標是把圖丟給AI
叫它照著圖寫程式
然後要有基本的驗證輸入欄位功能
像是你email沒填
或是密碼格式不對要檢查之類的
我的提示詞如下:
使用html css javascript網頁前端技術
請完全依照設計圖
製作一個註冊頁面
網頁裡各項欄位必須在驗證是否留空
密碼欄位需驗證是否至少含有一個大寫字母及一個特殊符號
驗證未通過在欄位右方加入提示方塊
接著各家AI產出的結果如下:
Gemini 2.0 Flash Thinking Experimental
https://thelonesomeera.com/signuptest/gemini/
ChatGPT o1
https://thelonesomeera.com/signuptest/chatgpt/
Claude 3 Haiku
https://thelonesomeera.com/signuptest/claude/
DeepSeek R1
https://thelonesomeera.com/signuptest/deepseek/
大家可以自己進去玩一玩比較一下
這些都是AI產出的我一行程式碼都沒有改完全複製貼上
然後也沒有串接後端程式和資料庫所以你真的點Sign Up也不會紀錄任何資料
懂程式的可以自己右鍵檢查看code或直接下載回去研究
結論是我想我還是繼續用ChatGPT好了
Gemini那個新模型四天前剛出
總算是有進步了
然後皮皮鬼也有去給川皇下跪
GOOG現在可以考慮進場...吧?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.31.248 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1737797852.A.48C.html
1F:→ MoonCode : 你倒是講一下差異 01/25 17:44
2F:推 itwt : 差異自己測一下就知道吧... 01/25 17:46
3F:推 iaminnocent : CHATGPT 跟Claude是真的有規則的,沒有達成規則會 01/25 17:52
4F:→ iaminnocent : 跳出提示,Chatgpt填寫完成還有註冊成功訊息XD 01/25 17:52
5F:→ iaminnocent : deepseek的R1我剛剛也有跟ChatGPT o1進行同問題測 01/25 17:54
6F:→ iaminnocent : 試,在路徑規劃問題上O1推理得到正確路徑,R1則是 01/25 17:54
7F:→ iaminnocent : 完全錯誤,另外毒藥問題上也是O1回答比R1好 01/25 17:54
8F:→ Lenon4561 : 聽君一席話 如聽 01/25 18:10
9F:→ silveriii : Claude Sonnet比較強 Haiku是來聊天的 01/25 18:46
10F:→ karcher : Gemini連切版都會,感覺web前端快失業 01/25 19:34
11F:→ karcher : 看來要找工程師直接找全端了 01/25 19:37
12F:推 INIKS : 功能普通,不支援圖形語音,這種文字模型不是到處都 01/25 20:16
13F:→ INIKS : 是嗎? 01/25 20:16
14F:→ INIKS : 一看價格.....真香! 01/25 20:16
16F:推 newyorker54 : 你不要這麼專業好不好,中吹會崩潰 01/25 20:38
17F:推 ohha0221 : 但價錢差很大 一分錢一分貨 XD 01/25 21:02
18F:→ ActionII : 這個就是對岸擅長的啊,雖然你的比較好,但我的巨 01/25 21:16
19F:→ ActionII : 便宜 01/25 21:16
20F:→ ActionII : 這種東西落地就是要看成本,這東西只有一半好用但 01/25 21:18
21F:→ ActionII : 成本差了幾個數量級 01/25 21:18
22F:→ ActionII : 那些meta 的人恐懼的不就是這樣嗎 01/25 21:19
23F:推 ImHoluCan : 小米蘇7是保時捷沒錯 01/25 21:28
24F:推 yumumu : 推,不過你Claude怎麼拿Haiku,應該拿Sonnet吧 01/25 21:35
它說現在流量太高免費仔暫時停用
等開放再測一次
25F:推 TaiwanUp : 一拳超人 美中的差距就在這裡 01/25 22:12
26F:→ ken85 : 飛彈很精準好用 但是決定戰場的是便宜的無人機吧~~ 01/25 22:21
※ 編輯: strlen (118.169.31.248 臺灣), 01/25/2025 22:23:13
27F:推 doubi : Claude 寫程式一定要選 Sonnet, 真心不騙 01/25 23:46
28F:→ doubi : 成功率比 ChatGPT 好很多 01/25 23:47
29F:→ doubi : Deepseek 的 Code 我沒有一次採用 ... 01/25 23:47
30F:→ doubi : 但是文書處理 DeepSeek 蠻好用的 01/25 23:47
31F:推 AudiA4Avant : Deepseek的降本架構拿去改良Meta的Model,不會讓meta 01/25 23:52
32F:→ AudiA4Avant : 更強嗎? 01/25 23:53
33F:→ TaiwanUp : DS證明偷工減料果然行不通 仍須更多基礎設施投資 01/25 23:58
34F:→ ActionII : 無人機是超乎想像好用,但傳統精準武器還是決定戰 01/26 00:04
35F:→ ActionII : 場啊 01/26 00:04
36F:→ TaiwanUp : 電詐好用 要牆內外買單訂閱還是免了 01/26 00:12