作者qazxc1156892 (QQ)

看板Stock

標題

[新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Cod

時間Fri Feb 6 22:25:52 2026

原文標題：緊咬Anthropic！OpenAI同日推GPT-5.3-Codex　跑分碾壓Opus 4.6 原文連結： https://ai.ettoday.net/news/3114219 發布時間： 2026年02月6日 08:48 記者署名：吳立言原文內容：兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Cl aude Opus 4.6，主打極長文本處理能力；OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex ，並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。 Claude Opus 4.6：導入深度思考機制與多代理協作 Anthropic 此次更新重點聚焦於大規模資訊處理與邏輯穩定性。Claude Opus 4.6 將上下文視窗（Context Window）擴展至 100 萬 Token，相較於前代版本提升 5 倍之多。技術層面上，該模型導入了「思考決策點」功能，使模型能辨識問題複雜度，自主決定是否啟動深度推理流程。此外，Opus 4.6 強化了多代理（Multi-agent）協作能力，並在長文本記憶留存率上提升近 4 倍，旨在解決長對話中常見的指令遺忘與邏輯斷層問題，針對大型專案的架構分析提供了更穩定的基礎。 GPT-5.3-Codex：優化生成效率與 OS 層級操控面對 Anthropic 的挑戰，OpenAI 推出的 GPT-5.3-Codex 則在編碼基準測試中交出了亮眼成績。數據顯示，該模型在 SWE-bench Pro（57%）、TerminalBench 2.0（76%）及 O SWorld（64%）等測試中，皆取得目前業界最高水準。除了跑分優勢，GPT-5.3-Codex 在開發體驗上有兩項核心突破：中途干預能力（Mid-task Steerability）：支持任務執行過程中的即時引導與動態更新，大幅降低複雜開發任務的錯誤成本。效能密度提升：生成相同內容所需 Token 數降至 5.2-Codex 的一半以下，且每 Token 生成速率提升超過 25%，顯著優化了推理成本與延遲。這兩款模型的發布顯示出兩家公司發展策略的差異化：Claude 傾向於成為具備超長記憶與深度邏輯的「數位大腦」；而 GPT-5.3-Codex 則朝向具備系統操作能力、高效率且可高度受控的「執行工具」進化。隨著 GPT-5.3-Codex 正式上線，開發者將有機會直接對比這兩款頂尖模型在實際工作流中的表現差異。心得/評論： Google Gemini表示：....... 現在AI變成跟智慧型手機一樣比跑分了這兩款token都一下子就用完了 Open醬看起來真的急了以前是領頭羊現在被追趕著不擠牙膏了 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.178.34 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1770387954.A.56C.html

1^F：推 devidevi : 跑分是啥鬼東西 02/06 22:27

2^F：推 iwcuforever : 每個月輪流測不同工具，目前來說還真的各有各優點 02/06 22:27

3^F：推 gladopo : 最近open醬的更新看來不錯，急了 02/06 22:27

4^F：推 b2060027830 : google 下去 02/06 22:28

5^F：→ iwcuforever : Gemini強在多模態和notebooklm生簡報，Claude生出 02/06 22:30

6^F：→ iwcuforever : 的文本就是比較嚴謹和有邏輯性，Chatgpt感覺就中庸 02/06 22:30

7^F：→ iwcuforever : 版本 02/06 22:30

8^F：推 kanehhh : 哪個模型能降低記憶體的需求就是利多 02/06 22:37

9^F：推 yousking : 歐噴醬最近中文很強，給股票分析模型還會有（噴爆） 02/06 22:38

10^F：→ yousking : 等字眼.... 02/06 22:38

11^F：推 jackychen122: Gemini寫程式跟老頑固博士生一樣，不停不做就是不做 02/06 22:40

12^F：推 offstage : 搞不好被餵進了PTT股板當學習資料 02/06 22:41

13^F：推 George72 : 緊咬是落後者的動詞 02/06 22:45

14^F：→ csgowen : 寫程式還是喜歡claude 02/06 22:47

15^F：→ LimYoHwan : 手機用戶通常主力一隻，寫程式很多人是claude, code 02/06 22:48

16^F：→ LimYoHwan : x, gemini三個都打開來用好嗎 02/06 22:48

17^F：→ LimYoHwan : Claude, codex左右互搏，gemini負責ui設計 02/06 22:49

18^F：推 Toge : 其實我覺得codex寫code略強一點，但Claude很適合當 02/06 22:50

19^F：→ Toge : 老師 02/06 22:50

20^F：→ LimYoHwan : 看新聞說claude比較強的人一看就知道沒用真的用過， 02/06 22:52

21^F：→ LimYoHwan : 就算5.2都不輸 02/06 22:52

22^F：推 pt993526 : Gpt目前速度有感提升 02/06 22:53

23^F：推 tarcowang : openAI是不是有派臥底啊？ 02/06 22:53

24^F：推 sova0809 : 這兩個打架受傷的是其他軟體公司 02/06 22:53

25^F：→ jjjj222 : 看我跑分, 好像之前安卓機出來會說的話 02/06 22:55

26^F：推 Toge : codex一口氣寫出想要的功能機率比較高 02/06 22:55

27^F：推 Faker0613 : 說codex比較屌是沒用過claude code+skills喔幹根 02/06 23:05

28^F：→ Faker0613 : 本屌打codex 02/06 23:05

29^F：→ redbeanbread: 擠牙膏喔人家出你才出 02/06 23:06

30^F：推 tsubasawolfy: Codex 5.3抓bug能力有嚇到。講了一下某步驟的數字 02/06 23:09

31^F：→ tsubasawolfy: 跟原始資料有落差而已，他就開始順著開著文檔內的 02/06 23:09

32^F：→ tsubasawolfy: 位址一個script爬過一個檢查。然後要求系統權限開 02/06 23:09

33^F：→ tsubasawolfy: 始對每個步驟模擬進行跟除錯。最後跟你說是哪個地 02/06 23:09

34^F：→ tsubasawolfy: 方有問題，問你要不要修正。修完後還說我順便幫你 02/06 23:09

35^F：→ tsubasawolfy: 其他關聯的script都修改好了。 02/06 23:09

36^F：推 strlen : 這次發表的都是專門寫程式的跑分不用看了都垃圾 02/06 23:10

37^F：→ strlen : codex之前就蠻強的只是速度真的太慢了 02/06 23:11

38^F：→ strlen : 這次明顯把短板改進速度提升許多就還不錯了 02/06 23:11

39^F：→ strlen : 現在codex基本能與opus並駕其驅甚至部份超越 02/06 23:12

40^F：→ strlen : opus價格太貴了也是劣勢就是了 02/06 23:12

41^F：→ strlen : 然後前兩天codex也出了寫程式專用的App 那個讚 02/06 23:13

42^F：→ strlen : CLI就留給那些臭酸老肥宅跟裝逼仔用 02/06 23:14

43^F：→ strlen : 電腦發明都幾年了還在回去弄CLI 低能到有剩 02/06 23:14

44^F：→ strlen : 另外skills基本就是脫褲子放屁跟MCP一樣遲早過氣 02/06 23:16

45^F：→ strlen : skills底層就是提示詞工程最後全都會整合進LLM裡 02/06 23:17

46^F：→ strlen : 還在那邊玩skills 都是過渡期在用的廢物功能 02/06 23:17

47^F：→ LimYoHwan : https://i.mopix.cc/iEUpK8.jpg 02/06 23:18

48^F：→ LimYoHwan : https://i.mopix.cc/qJhqIf.jpg 02/06 23:18

49^F：→ LimYoHwan : https://i.mopix.cc/VcT2vs.jpg 02/06 23:18

50^F：→ LimYoHwan : Openclaw作者都這樣說了推文的你真的有用過？ 02/06 23:19

51^F：→ LimYoHwan : https://i.mopix.cc/31W7EU.jpg 02/06 23:20

52^F：→ strlen : 現在模型進步太快有人不是每天刷推特不曉得不是他 02/06 23:22

53^F：→ LimYoHwan : 現在就華爾街帶風向說openai不行跟去年講goog一樣 02/06 23:22

54^F：→ LimYoHwan : 的套路故意打壓股價 02/06 23:22

55^F：→ strlen : 的錯他的印象還留在寫程式=claude 02/06 23:22

56^F：→ strlen : Openclaw作者一開始也是只用claude 後來交叉使用才 02/06 23:22

57^F：→ strlen : 自己比較出優劣 02/06 23:23

58^F：→ jjjj222 : 讓我想起了vim還是emacs還是vscode比較好的討論.. 02/06 23:24

59^F：→ jjjj222 : 在此預言, 不會有結論.... 02/06 23:24

60^F：→ strlen : 我以前碰過幾個vim死忠仔共同特徵就是又老又肥脾氣 02/06 23:25

61^F：→ strlen : 陰陽怪氣甚至其中一個連git都不會用只用小烏龜 02/06 23:25

62^F：→ strlen : 裝逼仔＋老肥宅無一例外 02/06 23:26

63^F：→ strlen : 不會進步的工程師在傳產一待就是20年 20年如一日 02/06 23:26

64^F：→ strlen : 這就是CLI愛好者的形象 02/06 23:26

65^F：→ LimYoHwan : Coding用很兇的人，全部都會用啦，各有優缺點，但 02/06 23:27

66^F：→ LimYoHwan : 體感，codex最強，只是速度慢。並不像車子一樣，大 02/06 23:27

67^F：→ LimYoHwan : 部分人選一種品牌 02/06 23:27

68^F：→ strlen : 不過就無聊抬槓在軟缸板講這個就是大爆炸然後被桶 02/06 23:27

69^F：推 Serisu : 現在寫程式就在比拼工具練了，誰還在拿模型互比 02/06 23:28

70^F：→ strlen : 本來就是交叉使用但我最近有點懶的主力就codex就 02/06 23:28

71^F：→ strlen : 好 claude太貴了啦用沒幾次額度就沒了三洨 02/06 23:28

72^F：→ strlen : 當然要互比像Gemini就是垃圾我說寫程式 02/06 23:29

73^F：→ Serisu : 規格丟上去就等收割了，到底有啥額度問題 02/06 23:29

74^F：→ strlen : 寫程式SOTA就是codex claude 沒了 02/06 23:29

75^F：→ strlen : 其它都是浪費時間時間就是金錢 02/06 23:30

76^F：→ LimYoHwan : 華爾街現在吹gemini 一狗票人也認為goog很強，開始 02/06 23:30

77^F：→ LimYoHwan : 要被套了 02/06 23:30

78^F：→ strlen : 當然gemini強項本來就在生圖之類的可理解啦 02/06 23:31

79^F：→ strlen : 狗家也有投資Antropic 大概是一個打消費一個打企業 02/06 23:31

80^F：→ strlen : 說好要聯合把歐噴醬幹死二打一 02/06 23:32

81^F：→ strlen : 巨頭血戰連續劇讓窩們繼續看下去 02/06 23:32

82^F：→ m30127813 : 離線ai值得期待嗎？ 02/06 23:33

83^F：推 messi5566 : Codex一直都屌打G 02/06 23:37

84^F：→ messi5566 : 網頁版Gemini最近在一些實時跑分排名上還偷偷變笨 02/06 23:37

85^F：噓 mini178 : 把dickshit放哪裡? 02/06 23:39

86^F：推 GX90160SS : 用AI寫是很爽但感覺人類背的責任反而又更多了 02/06 23:43

87^F：→ GX90160SS : 以前維護一個專案 -> 用AI寫後變成要維護三專案以上 02/06 23:43

88^F：推 joy2105feh : 但GOOG強的點不只GEMINI阿XD 02/06 23:54

89^F：推 chachabo : 99估狗 02/06 23:55

90^F：→ yunf : 一人150萬美金不要太羨慕啊 02/06 23:57

91^F：→ strlen : 我沒說狗家不強啊搜我的文去年低點開始買的 02/07 00:11

92^F：推 stocktonty : 沒有成人模式都不用談 02/07 00:14

93^F：推 bhmagic : 偷偷變笨歐噴也有過但現在好像不敢了 02/07 00:16

94^F：→ bhmagic : 每個AI都有時候會故意用省資源的方式回答你 02/07 00:17

95^F：推 L1ON : gemini: gpt還在呼吸啊 02/07 00:23

96^F：推 s213092921 : 美國還在閉源模型的賽道死路內捲啊 02/07 00:29

97^F：推 omanorboyo : google一樣是最後贏家啦因為他才有轉換成$$的能力 02/07 00:40

98^F：→ b9513227 : 井蛙又在丟臉了 codex本來就不差 02/07 00:55

99^F：→ b9513227 : 至於gemini 這垃圾連競爭資格都沒有 02/07 00:55

100^F：推 quanhwe : Chatgpt要活著比較好不然Gemini會擺爛 02/07 03:00

101^F：推 myth356 : GPT現在很卡頓欸 02/07 03:17

102^F：→ e123456ddd : 現在會講什麼最後贏家的也很蠢根本還太早期 02/07 04:36

103^F：推 andy79323 : 用過vibe coding不會說出不同模型 02/07 07:21

104^F：→ andy79323 : 程式碼分工這種事 02/07 07:21

105^F：→ andy79323 : 用一款調架構就可以搞鼠自己了 02/07 07:21

106^F：→ KingTsia : 超明顯沒料了你更新我才更新 02/07 07:53

107^F：推 GinginDenSha: 軟體圈每天就是一堆優越仔，鄙視鏈 02/07 08:22

108^F：→ shiyangfoo : 沒人覺得祖家的方式才是最聰明的嗎 02/07 09:02

109^F：→ D600dust : 5F Gemini生出來的不叫簡報請你去用過Kimi再說強 02/07 09:42

110^F：→ jjjj222 : win和mac吵, iphone和android也吵, 老吵了 02/07 15:42

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Stock 板

[新聞] 緊咬Anthropic！OpenAI同日推GPT-5.3-Cod

熱門看板

贊助商連結