作者jeff0025 (無法顯示人物名稱)

看板Stock

標題

[新聞] GPT-5.2正式亮相！長文件推理逼近滿分、

時間Fri Dec 12 08:33:50 2025

原文標題： GPT-5.2正式亮相！長文件推理逼近滿分、企業應用大進化原文連結： https://ai.ettoday.net/news/3082692 發布時間： 2025年12月12日 06:09 記者署名：吳立言原文內容： OpenAI 今（12日）正式推出全新一代模型 GPT-5.2，主打專業知識工作、長任務代理（ agentic workflows）與複雜專案處理能力。OpenAI 表示，GPT-5.2 是目前最強大的模型系列，包含 Instant、Thinking 與 Pro 三種版本，將率先於 ChatGPT 付費用戶陸續開放，本日同步於 API 全面上線。 OpenAI 指出，GPT-5.2 的設計目標是協助專業人士提升效率，從製作試算表、簡報、撰寫程式碼，到解析影像、理解長文件、運用工具與執行多步驟任務。根據官方數據，一般企業戶平均每天可節省 40～60 分鐘，重度用戶甚至可省下每周10 小時以上。 GPT-5.2 Thinking 在多項專業與推理評測創下新高，其中包含： GDPval（知識工作評測）：在 44 種職業任務測試中，GPT-5.2 Thinking 與產業專家相比 70.9% 達到平手或勝出，首次達到「整體專家級表現」。程式能力：在 SWE-Bench Pro 實際軟體工程測試中達到 55.6% 正確率，刷新既有紀錄。 SWE-bench Verified（Python）：提升至 80%。高難度數學 FrontierMath（Tier 1–3）：提升至 40.3%，為新 SOTA（state of the art）。 AIME 2025（競賽數學）：達到罕見的 100%。這代表該模型在真實世界的工作流程中，更能自主偵錯、完成功能開發、重構大型程式碼庫及協助工程團隊提升開發速度。 GPT-5.2 在多項核心能力上也明顯提升。首先，長上下文推理表現突破新高，在 OpenAI MRCRv2 測試中，模型於 256k tokens 的 4-needle 任務中接近 100% 準確率，特別是在 128k～256k 範圍仍維持高度穩定，意味著能更可靠處理動輒數十萬字的合約、研究論文與大型專案文件。視覺理解方面同樣強化，GPT-5.2 Thinking 在科學圖表辨識（CharXiv）中的錯誤率約減半，在專業介面理解（ScreenSpot-Pro）更大幅領先前代，使其更適用於金融、營運、工程與設計等高度依賴視覺資訊的領域。工具調用能力則刷新紀錄，在 τ2-bench Telecom 多輪任務中成功率達 98.7%，能更完整處理跨步驟流程，例如客服案件、資料擷取與一條龍分析生成。至於科研能力，GPT-5.2 在 GPQA Diamond 高難度理科題目中也取得 92～93% 的高分， OpenAI 稱已有研究團隊在其協助下於統計學問題上產生具研究價值的證明，並經外部專家驗證，展現其在科學與數學研究上的實質潛力。 API 定價部分，GPT-5.2 為每百萬字元 1.75 美元（輸入）與 14 美元（輸出）， GPT-5.2 Pro 則為每百萬字元 21 美元（輸入）與 168 美元（輸出）。OpenAI 表示，雖然 GPT-5.2 單位成本較高，但由於模型在推理效率與生成品質上更精準，實際完成同等品質任務所需的總成本反而有機會降低。GPT-5.2 提供三個版本： Instant：快速、涵蓋大多數日常任務 Thinking：適合深度推理、文件分析、程式碼與大專案 Pro：最強版本，適合困難領域與最高品質需求 OpenAI 表示 GPT-5.2 整體輸出更一致、有條理，並針對敏感內容（心理健康、自傷訊息等）加強安全應答。ChatGPT Plus／Pro／Business／Enterprise 今日起陸續開放， GPT-5.1 將在三個月後從 ChatGPT 中下架（API 不受影響）。心得/評論：已反應? 這次發布後好像沒啥人在意 AI真的要泡沫化了嗎? 感覺OpenAI一直強調多強好像對一般使用者來說根本無感 Gemini有完整生態系還送2TB雲端空間又能一個人購買多人共享然後生成圖片又強 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1765499634.A.473.html

1^F：推 Tohkachan : gemini 便宜又大碗 12/12 08:35

2^F：推 MorikonHase : gemini 不後悔中 12/12 08:35

3^F：推 Muilie : 瑟瑟呢！奧特曼也唬爛嘴！ 12/12 08:36

4^F：→ zzzzzzzzzzzy: 沒用了，永遠被gemini踩在腳下摩擦 12/12 08:36

5^F：推 lawyer94 : 話說grok被蛋雕了嗎 12/12 08:37

6^F：推 js01078687 : 競爭對消費者是好事 12/12 08:37

7^F：推 ackes : 一般人用不到的關係吧通常都只是查查東西畫畫圖 12/12 08:37

8^F：推 rxsmalllove : 抱歉估狗也會下去 12/12 08:37

9^F：推 sssallen : 不錯喔 12/12 08:38

10^F：推 ben121196 : 這邊一片看衰那我知道穩不穩了 12/12 08:39

11^F：→ mamorui : 圖咧！菇菇當初訂閱歐噴醬是為了圖！ 12/12 08:39

12^F：推 qqtab : 谷歌被吹到獨自跳水 12/12 08:42

13^F：推 kuosos520 : grok蠻好用的呀 12/12 08:42

14^F：→ agoo : gpt 比較好用 12/12 08:42

15^F：→ b9513227 : gemini根本弱智速度慢又常常a問題完了問b問題跟 12/12 08:43

16^F：→ b9513227 : 我講a問題 12/12 08:43

17^F：推 tamama000 : 記者可以去了 12/12 08:43

18^F：推 fhjqwefs : 持續競爭是好事台股3W6就靠鏟子商cc 12/12 08:43

19^F：→ tamama000 : 隨時被取代 12/12 08:43

20^F：推 Phineas2635 : 繼續吹 12/12 08:44

21^F：推 HiuAnOP : 瑟瑟Ai呢？沒有就掰掰 12/12 08:44

22^F：→ tctv2002 : 繼續競爭鏟子供應鏈發大財 12/12 08:44

23^F：→ tctv2002 : 等他們不競爭台灣就走向日本失落20年 12/12 08:44

24^F：推 LoveSports : https://i.imgur.com/N6V3Kkv.png 12/12 08:44

25^F：→ idernest : 好了啦奧特曼 12/12 08:45

26^F：推 ABC610478 : 因為有對手了 12/12 08:45

27^F：推 YumingHuang : GPT-99.9出的時候叫我、謝謝 12/12 08:45

28^F：→ LoveSports : 加強後訓練之後各家最新模型ARC-AGI-2高達50幾趴 12/12 08:46

29^F：→ LoveSports : 同一個類神經網路透過後訓練加強能力 12/12 08:46

30^F：→ YumingHuang : Grok走即時資訊串流鏈的樣子？ 12/12 08:46

31^F：推 karta018 : 不用吹，拿幾題測試下去就知道了，上次gemini是真的 12/12 08:46

32^F：→ karta018 : 拉開差距 12/12 08:46

33^F：推 smallkop : 真的厲害就不用自己發新聞了 12/12 08:47

34^F：→ LoveSports : 代表預訓練難以再突破不用推出GPT6就能有大幅進步 12/12 08:47

35^F：→ LoveSports : 美國比較多企業用戶已經用習慣GPT不會輕易換Gemini 12/12 08:48

36^F：→ LoveSports : OPEN AI得為了那些企業用戶趕上差距 12/12 08:49

37^F：推 jinxinmypant: 晚了就不要了 12/12 08:49

38^F：推 andy79323 : 過幾天開源的要發新模型 12/12 08:49

39^F：→ appledick : 現在其實已經很夠一般人使用了阿....算力過剩了 12/12 08:50

40^F：→ LoveSports : 這篇增強能力都是專業用途的，這個方向是對的 12/12 08:50

41^F：噓 strlen : 現在AI評測早就不重要的喜歡哪個AI全都是靠感覺 12/12 08:50

42^F：→ LoveSports : 光靠閒聊談限制級無法留住那些企業用戶 12/12 08:50

43^F：→ appledick : AI現在的問題是同時有巨量的人使用才會有問題..... 12/12 08:50

44^F：→ strlen : 就跟智慧手機差不多哪一牌的旗艦機功能幾乎一樣 12/12 08:50

45^F：→ strlen : 看硬體跑分也是看爽的實際上打遊戲幾乎沒差別 12/12 08:51

46^F：→ strlen : 什麼Gemini比較好 Grok比較強 GPT更人性都是感覺 12/12 08:51

47^F：→ strlen : 真叫你說差在哪你也說不出來差別啦笑死 12/12 08:52

48^F：→ appledick : 現在是看那些應用可以拿AI拿來重大突破才有意義 12/12 08:52

49^F：→ luche : grok的語文意義掌握好像與其他家不同覺得特別強 12/12 08:53

50^F：→ appledick : 不然前陣子G奶夯的時候去用GTP順到炸 12/12 08:54

51^F：推 LoveSports : 我前陣子丟六篇不同長文給各家AI分析 Gemini 3.0沒 12/12 08:54

52^F：→ strlen : 上次看OpenRouter報告 AI現在就兩大剛需應用這是付 12/12 08:54

53^F：→ LoveSports : 有搞錯六篇分別的作者 (六個作者有回來回去) 12/12 08:54

54^F：→ strlen : 費慾望最強烈的 1.聊天打屁 2.寫程式沒了 12/12 08:54

55^F：→ LoveSports : GPT5.1跟Grok4都混淆 12/12 08:54

56^F：推 fhjqwefs : 重大突破沒意義能省更多人力訂閱越划算產生盈餘才 12/12 08:54

57^F：→ fhjqwefs : 有意義 12/12 08:54

58^F：→ strlen : 其它需求和用量遠遠比不上聊天跟寫程式 12/12 08:54

59^F：推 deann : 打開還是5.1版阿 12/12 08:55

60^F：→ strlen : LLM公司要真聰明就該衝這兩個就好尤其是寫程式 12/12 08:55

61^F：噓 OxFFFF : 工作及生活交叉使用比對後，覺得chatGPT 最廢最藏 12/12 08:55

62^F：→ LoveSports : 專業用途的企業用戶也很重要，評測結果影響投資 12/12 08:55

63^F：推 FOREVER49KG : 好 12/12 08:55

64^F：推 deathoflove : 真的企業用的話某些比較保守的產業會優先用M軟cop 12/12 08:55

65^F：→ deathoflove : ilot 對很爛但誰叫他是M軟內部DD做起來無慮 12/12 08:55

66^F：推 goodevening : ai總結文章影片跟財報很不錯阿，我就是因為這樣買ge 12/12 08:55

67^F：→ goodevening : mini 12/12 08:55

68^F：推 leo850319 : image gen呢被谷歌打到不做了? 12/12 08:56

69^F：推 DogEggz : gork色色一統天下 12/12 08:56

70^F：推 flash789 : 只剩瑟瑟能夠救得了cpt了 12/12 08:56

71^F：噓 sssallen : G除了玩圖有比較厲害? 12/12 08:57

72^F：推 rxsmalllove : 我是覺得AI準確性和安全性再提高一般企業就會是消費 12/12 08:57

73^F：→ rxsmalllove : 主力了 12/12 08:57

74^F：→ appledick : G玩圖下的指令要很清楚 GTP反而不用 12/12 08:58

75^F：→ appledick : 這就是為啥大家說GTP比較人性用很白話的方式就可以 12/12 08:58

76^F：推 LoveSports : 那些AI工程師的夢想是要AI解決人類困境所以企業或 12/12 08:59

77^F：→ LoveSports : 研究方面用途絕對是他們前進的目標之一 12/12 09:00

78^F：→ LoveSports : 不能單純看到一堆人在玩角色扮演談色情就限制框架 12/12 09:00

79^F：→ LoveSports : 很多人就著重閒聊就好，矛盾的是又會被批只能聊天 12/12 09:01

80^F：推 Vincent8026 : 道德限制還是很硬 12/12 09:02

81^F：→ LoveSports : 很多人說著重聊天就好，意思是認定模型只能當笨蛋 12/12 09:02

82^F：→ LoveSports : 給人類當聊天陪伴對象或性奴就好，這種觀念太狹隘了 12/12 09:03

83^F：推 rxsmalllove : OAI有在跟消費者端的企業合作啊只是不成功變成仁？ 12/12 09:03

84^F：推 jerrychuang : 可以做ppt嗎？ 12/12 09:03

85^F：推 ikachann : GPT比較好用+1 12/12 09:04

86^F：→ ikachann : 一樣的指令下去 GPT產出的明顯比Gemini的完整且正確 12/12 09:05

87^F：→ miss32 : 是大量跳槽gemini嗎最近gemini速度變好慢 12/12 09:05

88^F：推 puppy20308 : 難怪蘋果不跳下來競爭，太激烈了，等你們打完最後 12/12 09:06

89^F：→ puppy20308 : 再來收割 12/12 09:06

90^F：推 decorum : AI讓我放棄出家庭作業給學生的做法評量都回歸測驗 12/12 09:07

91^F：→ decorum : 過去最重視的期末報告都免了因為作者八成是AI 12/12 09:08

92^F：推 mynumber55 : Gemini 最近跟屎一樣 12/12 09:09

93^F：推 linch416 : google生態系根本無敵 12/12 09:11

94^F：→ decorum : 學位論文還是不能免得花許多力氣查驗真的很討厭 12/12 09:12

95^F：推 aqlec : 哪款可以色色？ 12/12 09:12

96^F：推 snowdraught : 跑一張圖片太久了 12/12 09:12

97^F：→ terry955048 : 碼農快被消滅了..... 12/12 09:13

98^F：→ decorum : 又不能禁用因為畢業出去運用AI是基本謀生技能 12/12 09:13

99^F：推 doubi : 不知道為啥，這次不是很在意，懶得測 ... 有點麻痺 12/12 09:15

100^F：→ dslite : 變成一個問題想三分鐘嗎？ 12/12 09:16

101^F：→ doubi : 其實 Gemini GPT Grok 都差不多能用，生活中確實也 12/12 09:17

102^F：→ doubi : 會用，所以選最划算的買 12/12 09:17

103^F：→ dslite : Grok答錯率有夠高還敢嗆我 12/12 09:17

104^F：推 liliumeow : 是不是又要買回去了還是雙棲好了 12/12 09:18

105^F：推 ntr203 : 急了 12/12 09:19

106^F：推 Fubukichan : Gemini最近用3.0的回答都遠不如5.1的品質跟長度 12/12 09:21

107^F：→ dream12305 : GTP是什麼笑死 12/12 09:22

108^F：推 WeiRaymond : Gemini真的強 12/12 09:25

109^F：推 guanting886 : Gemini最近應該是一狗票人跳過去連語音講話的調調 12/12 09:26

110^F：→ guanting886 : 都變怪了 12/12 09:26

111^F：→ jenchieh5 : gemini回答那個語氣看久了蠻討厭的，就很會幫既有利 12/12 09:28

112^F：→ jenchieh5 : 益者粉飾太平的感覺 12/12 09:28

113^F：→ guanting886 : GPT5.2強可能反過來想前面幾代模型都做不到現在做 12/12 09:28

114^F：→ guanting886 : 得到發code red突然就變好了想必這個模型可能成 12/12 09:28

115^F：→ guanting886 : 本不低 12/12 09:28

116^F：推 GOOGOOfish : 問題是B2B會比B2C還轉錢嗎？ 12/12 09:28

117^F：推 chachabo : 不要再害goog了 12/12 09:28

118^F：推 doubi : GPT 5.2 的圖片生成好像中文一樣是鬼畫符 12/12 09:29

119^F：→ guanting886 : 甜蜜期應該是這一個二個月後面等大家benchmark跟 12/12 09:29

120^F：→ guanting886 : arena打一打可能就慢慢降回去能力了 12/12 09:29

121^F：→ doubi : 其實 Gemini 3 會起飛，很大程度是懂中文的關係 12/12 09:29

122^F：→ doubi : Banana 還是比較好用 12/12 09:30

123^F：→ guanting886 : Google除了學術資料、PDF OCR做很足，還有海量的數 12/12 09:32

124^F：→ guanting886 : 據再配合GA的資料真要挑高品質的資料去訓練比Op 12/12 09:32

125^F：→ guanting886 : enAi還有優勢 12/12 09:32

126^F：→ elvaismylove: 這連擠牙膏都不算 12/12 09:32

127^F：推 pt993526 : 再訂閱回來 12/12 09:33

128^F：推 willion003 : 2TB太邪惡了，還共享 12/12 09:34

129^F：推 Sawilliam : 都有付費用起來grok最鳥老是忘記之前跟他建好的 12/12 09:35

130^F：→ Sawilliam : 規則..回答也一堆錯但grok對某方面限制條件最少.. 12/12 09:35

131^F：推 Lowpapa : 沒人在乎 12/12 09:35

132^F：→ bnn : 有反應啊辜狗又要跳水了 12/12 09:36

133^F：推 redbeanbread: 雷曼殺到ai叫媽媽 12/12 09:37

134^F：推 guanting886 : Gemini圖裡面的中文做得比較好就Google的圖資比 12/12 09:37

135^F：→ guanting886 : 較多樣、品質也高這都是擴散模型生的 12/12 09:37

136^F：→ guanting886 : OpenAI想要差不多水準就是花錢買別人的 data 12/12 09:38

137^F：噓 ryan1220 : 我跳出來又站回去了你打我啊笨蛋 12/12 09:39

138^F：→ guanting886 : 但你真的追不上地表最強的爬蟲 12/12 09:39

139^F：→ OOorc : 垃圾公司 12/12 09:39

140^F：推 mouscat : 反正軍備競賽打越兇供應鏈都贏 12/12 09:41

141^F：推 alsoty : GPT可以語音聊天，其他的好像都還不行？ 12/12 09:46

142^F：→ hatland86 : 早在幾個月前就退訂GPT用Gemini 但我不覺得是誰超 12/12 09:47

143^F：→ hatland86 : 越誰的問題發展到後面應該是會並行 12/12 09:47

144^F：推 gladopo : 可以色色嗎 12/12 09:48

145^F：推 ilovebig99 : 最近Gemini 根本就連不上，好幾次一個問半天沒回應 12/12 09:49

146^F：→ ilovebig99 : ，還是回去用ChatGPT 了，ChatGPT 都回玩了，Gemini 12/12 09:49

147^F：→ ilovebig99 : 還在那邊轉啊轉。 12/12 09:49

148^F：→ csy0922 : Notebooklm跟Nanobanana以外的Gemini就是一坨一堆 12/12 09:49

149^F：→ csy0922 : 有的沒的幻覺下指令這樣繼續瞎掰 12/12 09:49

150^F：推 shrimprock : AI模型看來沒護城河生態系才有谷歌勝 12/12 09:50

151^F：推 hotlatte : 開始小米化了 12/12 09:51

152^F：推 yulun1984 : 免費仔用G 12/12 09:51

153^F：推 mynumber55 : 很簡單啊，算力根本不夠 12/12 09:52

154^F：→ yunf : 不要再吹openai啦我知道他很厲害你不會出 gemini的 12/12 09:53

155^F：→ yunf : 比較喔 12/12 09:53

156^F：→ strlen : NanoBanana另一個點是為什麼可以無視版權生角色圖 12/12 09:54

157^F：→ strlen : GPT弄個吉卜力只是風格就被臭幹 12/12 09:54

158^F：→ strlen : Banana是可以直接生鬼滅吉伊卡哇角色 12/12 09:55

159^F：推 BBKOX : 戰國時代不要只壓一邊 12/12 09:55

160^F：推 bornwinner : 能自己更新程式碼再說 12/12 09:56

161^F：→ strlen : 然後沒人在乎狗家侵權？還是巨頭蛇麼都可以 12/12 09:56

162^F：推 Sean0211 : 現在目標是AI取代投顧那就真的神了 12/12 09:57

163^F：推 linleex : agi已經實現了 12/12 09:59

164^F：→ yunf : 投顧轉型用ai好嗎 12/12 10:00

165^F：推 heybro : 估狗屌打 12/12 10:00

166^F：推 as6633208 : 猛屌打Gemini 3 12/12 10:04

167^F：推 shrimprock : 跟瀏覽器大戰一樣最後贏不是誰強而是誰有作業系 12/12 10:04

168^F：→ shrimprock : 統 12/12 10:04

169^F：→ BBKOX : 作業系統就windows 12/12 10:05

170^F：→ as6633208 : 錯，現階段AI比的就是誰答案好，因為現階段AI還會犯 12/12 10:07

171^F：→ as6633208 : 傻有瓶頸，遠遠還沒到大家都一樣好比得是應用的階段 12/12 10:07

172^F：推 opticalman : 看來分歧，互有支持者，表示gpt gemini grok 差不 12/12 10:08

173^F：→ opticalman : 多就這樣了，很難落差很大 12/12 10:08

174^F：→ rxsmalllove : 你在看哪落差很大只是各有優勢 12/12 10:09

175^F：推 andboypig : 剛剛問了本人 5.2還沒發佈 12/12 10:09

176^F：→ mouscat : grok沒辦法跟這兩個比吧 12/12 10:09

177^F：推 SuiseiTrain : 反殺 12/12 10:10

178^F：推 as6633208 : 屌打Gemini 3 12/12 10:11

179^F：推 tsubasawolfy: 5.2付費用戶已經上了 12/12 10:12

180^F：推 opticalman : got deepseek Gemini gork gpt ....未來還有很多新 12/12 10:16

181^F：→ opticalman : 人橫空出世啦，水平會越拉越近，很難獨強 12/12 10:16

182^F：推 kakar0to : 被google生態系屌打 chatgpt這個穴已經沒用了 12/12 10:16

183^F：推 kenslc199 : 人多的地方不要去包含AI cc 12/12 10:17

184^F：推 Jeff1989 : 逼一逼還是能發揮潛能的 12/12 10:19

185^F：→ as6633208 : m365 copilot 就是一個例子，生態系比google還廣， 12/12 10:21

186^F：→ as6633208 : 但就是不好用，模型答案準確答案好才是重點，空有生 12/12 10:21

187^F：→ as6633208 : 態系沒屌用，模型夠強生態系反而小事 12/12 10:21

188^F：推 opticalman : 大家手上都有老黃的gpu，人人都有機會針對缺點優勢 12/12 10:23

189^F：→ opticalman : 去改善和挑戰領先者 12/12 10:23

190^F：→ bnn : 模型大家都還在改進啊這次gpt不就demo搞投影片生成 12/12 10:23

191^F：→ bnn : 自動做試算表這些功能之前就沒訓練還是LLM對話 12/12 10:24

192^F：→ bnn : 然後之前claude則是先著重代碼生成每家方針不同 12/12 10:25

193^F：推 breathair : 誰強點，誰弱點不重要，都差不多，沒有拉開代差，比 12/12 10:27

194^F：→ breathair : 氣長誰都知道誰會死，每個人都知道的話就是死亡螺旋 12/12 10:27

195^F：推 mikuyoyo : 有在用都知道gpt回答屌打全部，gemini 只是功能比較 12/12 10:27

196^F：→ mikuyoyo : 多和能跟Google整合而已 12/12 10:27

197^F：推 as6633208 : 笑死就是因為這條賽道打不贏，才會扯到外部生態系 12/12 10:28

198^F：→ as6633208 : ，誰錢多氣長 12/12 10:28

199^F：→ mouscat : 我覺得Gemini 的回答方式比較好懂啦 12/12 10:28

200^F：→ as6633208 : 就是輸人才一直扯外部找藉口 12/12 10:29

201^F：→ as6633208 : 超好笑 12/12 10:29

202^F：→ mouscat : Google是反NVDA大聯盟那邊的吧用AVGO晶片 12/12 10:31

203^F：推 breathair : 谷歌是打防守，跟進攻方的難度不是一樣的 12/12 10:34

204^F：推 yogofresh : 太貴了。有些問題我問DeepSeek反而能得到更好的回答 12/12 10:34

205^F：推 salamender : 有競爭才是好事，chatgpt還是有優點阿 12/12 10:41

206^F：→ shirleyEchi : 讓他來分析舊金山和約寫了什麼 12/12 10:43

207^F：推 kogsww : 來不及了已退訂 12/12 10:43

208^F：推 OhmaZiO : 5.2 也沒用還不是繼續說謊+詭辯+道歉 12/12 10:44

209^F：噓 rumblefish : AI不要再搶辦公室工作了 12/12 10:46

210^F：→ orz811017 : 現在就是反狗家聯軍進攻的回合 12/12 10:49

211^F：→ orz811017 : 六大教派圍攻光明頂 12/12 10:49

212^F：推 jboys75 : 每次都吹的很強結果…這次觀望一下 12/12 10:49

213^F：推 max117980 : ChatGPT 政策一大堆這個不行那個不行前陣子會兩邊 12/12 10:49

214^F：→ max117980 : 都貼對比一下答案真的還是Gemini 比較強已經好幾 12/12 10:49

215^F：→ max117980 : 天沒用GPT了 12/12 10:49

216^F：推 kakalin : 感覺各個AI專精不同領域也是不錯的分工 12/12 10:51

217^F：推 breathair : AI現在ToB各有各的強項本來就三大公雲，誰也沒有制 12/12 10:56

218^F：→ breathair : 霸，會一直一直一直競爭下去。ToC要顛覆谷歌的廣告 12/12 10:56

219^F：→ breathair : ，短時間就沒戲，除非有人先想好了怎麼讓消費者接受 12/12 10:56

220^F：→ breathair : AI灌給你廣告再來談 12/12 10:56

221^F：→ j32072 : 不能做瑟圖我不會買單的 12/12 10:58

※ error405:轉錄至看板 AI_Art 12/12 10:59

222^F：推 as6633208 : gpt一直努力保持道德中立，哪天gpt也像grok 一樣混 12/12 11:06

223^F：→ as6633208 : 亂邪惡就進化了 12/12 11:06

224^F：→ BBKOX : 博通夜盤怎麼了 12/12 11:09

225^F：→ searchroy : Google 還沒出手，open 醬亂成一團 12/12 11:10

226^F：推 SapiensChang: gemini絕對屌打gpt啦不管寫coding和資料正確性有g 12/12 11:12

227^F：→ SapiensChang: oogle搜尋結果比對正確性遠大於gpt 12/12 11:12

228^F：推 DrowningPool: 推理還是GPT贏 gemini光記憶力就跟智障一樣 12/12 11:14

229^F：→ SapiensChang: gpt到底有什麼強項？每項測試下來gpt都被碾壓你說g 12/12 11:15

230^F：→ SapiensChang: rok還有強項 gpt coding跑出來八成根本還要再debug 12/12 11:15

231^F：→ SapiensChang: 就claude和gemini幾乎都很正確 12/12 11:15

232^F：推 as6633208 : 同樣題目gpt 5.2 答案明顯比Gemini 3 pro更嚴謹，看 12/12 11:17

233^F：→ as6633208 : 不出所謂搜索之後答案更正確，要是這樣在測試跑分應 12/12 11:17

234^F：→ as6633208 : 該也贏gpt，而不是gpt全面碾壓評測 12/12 11:17

235^F：推 rxsmalllove : Gemini有幾乎都很正確？忍不住懷疑 12/12 11:18

236^F：推 SapiensChang: gemini每個對話的token是gpt的10倍記憶力正確但都 12/12 11:19

237^F：→ SapiensChang: 答不對的ai 和能撐超久的短時記憶 gemini還是好用很 12/12 11:19

238^F：→ SapiensChang: 多我每天都在用gpt plus和gemini pro 前面那個才是 12/12 11:19

239^F：→ SapiensChang: 很常給出智障答案…很受不了 12/12 11:19

240^F：推 yuchifan : 我比你強，我比你更強，幹比不完 12/12 11:19

241^F：推 rxsmalllove : 我目前使用心得相反 pro 的答案比Gpt更需要更正 12/12 11:22

242^F：→ SapiensChang: Gemini都很正確啊前陣子才把公司的EDA驗證flow靠ge 12/12 11:23

243^F：→ SapiensChang: mini和claude建立起來 chatgpt只會產出很多資訊垃圾 12/12 11:23

244^F：→ SapiensChang: 生活上就出國排行程搜索期刊 gpt只會給你一些不存 12/12 11:24

245^F：→ SapiensChang: 在的期刊不存在的景點 12/12 11:24

246^F：→ SapiensChang: 自從gemini pro 3.0幾乎就沒看它犯蠢過頂多送了跳 12/12 11:25

247^F：→ SapiensChang: 針一下 12/12 11:25

248^F：推 as6633208 : 架構規劃和研究gpt明顯更適合，Claude更適合執行，G 12/12 11:26

249^F：→ as6633208 : emini +Claude ，還不如gpt+Claude 12/12 11:26

250^F：推 Sunny821210 : Gemini醫學的問題問深一點會打錯 GPT反而答對最近 12/12 11:26

251^F：→ Sunny821210 : 的使用心得 12/12 11:26

252^F：推 DrowningPool: 某人的使用心得怎麼都跟我完全相反 ccc 12/12 11:28

253^F：推 rxsmalllove : 那我覺得應該是擅長領域不同吧我在用的是財務 12/12 11:28

254^F：推 mouscat : Gemini給我的感覺是「更會講人話」適合問一些非專 12/12 11:29

255^F：→ mouscat : 業科普性質問題 12/12 11:29

256^F：→ strlen : 那些都不重要都不會是核心應用 12/12 11:29

257^F：→ strlen : 核心就兩個聊天打屁跟寫程式自己去看報告 12/12 11:30

258^F：→ strlen : 查資料也不會是AI剛需那個Google就好了誰要付錢 12/12 11:30

259^F：推 rxsmalllove : 核心擴展不了現在的股價都是高估 12/12 11:32

260^F：→ SapiensChang: 可能真的是領域不同我是科技業啦 12/12 11:32

261^F：推 as6633208 : 重點是Agent自動化替代勞動力吧，你用tools的觀念沒 12/12 11:34

262^F：→ as6633208 : 人用的下去，tools依賴人，老黃說AI is work，要做 12/12 11:34

263^F：→ csy0922 : 財務相關的Geimni真的滿笨的，財報丟給他、Bloombe 12/12 11:34

264^F：→ csy0922 : rg資料庫的資料丟給他，都還會回答錯誤數字或說你 12/12 11:34

265^F：→ csy0922 : 的資料來源才是錯的 12/12 11:34

266^F：→ as6633208 : 成agent 那樣取代某個工作，讓那個工作的人只要看一 12/12 11:34

267^F：→ as6633208 : 下對不對，這個才是市場，取代勞動力不足，未來你公 12/12 11:34

268^F：→ as6633208 : 司擴廠那個agent 勞動力是24hr專注工作+回報，還可 12/12 11:34

269^F：→ as6633208 : 以無限加開部署，省去人力成本，增加勞動力才是AI最 12/12 11:34

270^F：→ as6633208 : 終目的 12/12 11:34

271^F：→ strlen : 那些都是用量極小對企業基本沒啥重大幫助的東西 12/12 11:35

272^F：→ strlen : 輔助型工具雞助到不行真正有生產力上質變的就是 12/12 11:35

273^F：→ strlen : coding 完全改變企業效率 12/12 11:35

274^F：噓 blackstyles : 不用了謝謝找個幾千個遊戲的網址都找不出來還不如 12/12 11:35

275^F：→ blackstyles : 我自己一個一個複製貼上真是謝了 12/12 11:35

276^F：→ strlen : coding接上去 token花費是天量這才能賺大錢 12/12 11:36

277^F：→ strlen : 那些什麼查資料三洨碗糕是能吃多少token 12/12 11:36

278^F：→ strlen : 量也完全不是寫code能比的 12/12 11:37

279^F：推 tsubasawolfy: 哪個年代GPT還會給你不存在的期刊... 12/12 11:43

280^F：推 rxsmalllove : 我認同但我還是認為股價要有未來性AI要對現有工作 12/12 11:43

281^F：→ rxsmalllove : 有強大的替代性 12/12 11:43

282^F：→ tsubasawolfy: 指定文獻資料庫跟peer review打下去就解決 12/12 11:44

283^F：→ tsubasawolfy: 真要說缺點就是一篇可以拿來廢話很多段 12/12 11:45

284^F：推 LoveSports : AI AGENT目前在美國模型使用率只有5~7趴還要很久 12/12 11:49

285^F：→ LoveSports : 這次因為OPEN AI因為要打贏Gemini 3.0 pro又暫緩AI 12/12 11:49

286^F：→ LoveSports : AGENT那方面的開發了 12/12 11:49

287^F：→ LoveSports : 上面那是正式使用的數字實驗性導入的企業20~25趴 12/12 11:51

288^F：推 muya318 : Gemini把服務綁定越深感覺之後就是走相簿養套殺路 12/12 11:52

289^F：→ muya318 : 線，你要那些資料就要繼續付錢 12/12 11:52

290^F：推 kobebrian : Gemini一直給我錯誤資訊連不同姓的人都給我說成是 12/12 11:53

291^F：→ kobebrian : 兄弟關係… 12/12 11:53

292^F：推 tony15899 : 問他周星馳跟周潤發是甚麼關係 12/12 11:57

293^F：→ stocktonty : 要噴爛了 12/12 11:59

294^F：噓 verydolungbe: 生態系？不就小網民乖乖付錢，是能賺多少？賺得贏微 12/12 12:00

295^F：→ verydolungbe: 軟？ 12/12 12:00

296^F：→ Heedictator : 奧特曼反擊！ 12/12 12:01

297^F：→ nakinight : GPT丸子 12/12 12:02

298^F：→ jickey : 滿分代表以後沒有進步空間了，崩！ 12/12 12:03

299^F：推 q111175 : Gpt還是比較好用 12/12 12:05

300^F：推 vltw5v : 有競爭者才會怕才會進步很好啊 12/12 12:07

301^F：推 NEX4036 : 美股永動機怎麼輸？ 12/12 12:07

302^F：→ NEX4036 : 估狗炒不動換老黃，老黃炒不動換估狗！ 12/12 12:07

303^F：推 diefish5566 : gemini問題在上下文注意力一坨非常快會忘記前文 12/12 12:14

304^F：→ diefish5566 : 測試你只問一兩次那當然很強 12/12 12:14

305^F：推 sdbb : 謝謝推文 12/12 12:15

306^F：推 GWang : AI夠用即可再來就比生態系 GPT輸到脫褲 12/12 12:18

307^F：推 koushimei : Gemini 遇到要大量演算時候的task就會亂講一通 12/12 12:20

308^F：→ koushimei : ChatGPT 還是屌打 12/12 12:21

309^F：推 salvationist: 說好的開放色色的呢？在那？ 12/12 12:21

310^F：推 chatbra : AI邊緣運算才是主戰場 12/12 12:21

311^F：→ gemm : Gemini現在bug一堆傳新圖會一直辨識成舊圖 12/12 12:26

312^F：推 shyshyan : gpt免費版就限制一堆一下子就叫你付錢 g奶免費版 12/12 12:26

313^F：→ shyshyan : 用起來比較爽 12/12 12:26

314^F：推 beavertail97: https://i.mopix.cc/n893d7.jpg 12/12 12:32

315^F：→ beavertail97: GPT這功能超好用，不會刪記憶，隨時開開新對話問它 12/12 12:33

316^F：→ beavertail97: ，都記得 12/12 12:33

317^F：推 kobebrian : Gemini的免費版根本不是給人用的錯誤太多 12/12 12:33

318^F：推 beavertail97: 也有買GEMINI, NOTEBOOKLM實在太好用 12/12 12:35

319^F：推 Sawilliam : 之前拿gpt 跟Gemini 同時算筆畫取名結果gpt 筆畫 12/12 12:37

320^F：→ Sawilliam : 都是錯的... 12/12 12:37

321^F：推 WSY000000000: 一樣吸金中 12/12 12:40

322^F：→ mouscat : 所有說Gemini錯誤多的是有用pro thinking 還是沒有 12/12 12:44

323^F：推 ivan761016 : GPT綁微軟才讚一堆企業用戶都用微軟怎麼酥 12/12 12:46

324^F：→ ivan761016 : 是一般用戶有錢還是企業用戶有錢想也知道 12/12 12:46

325^F：→ Kevinkkk52 : 目前體感grok錯誤率最高 12/12 12:47

326^F：→ NingK : 結果還是不能色色 12/12 12:49

327^F：推 CKRO : 急了 12/12 12:53

328^F：推 applejone : Gemini現在伺服器就滿載中算力不夠 12/12 13:01

329^F：→ TGTplayer : 香蕉獨孤求敗 12/12 13:02

330^F：→ stocktonty : 瑟瑟只能去GROK 12/12 13:03

331^F：推 kingofsdtw : 企業用戶也無法色色... 12/12 13:22

332^F：推 duriel3313 : grok, gemini GPT都有買文字還是GPT最好 12/12 13:24

333^F：推 magier : gemini3幻覺很多 12/12 13:31

334^F：推 House23 : 關鍵字：付費 12/12 13:36

335^F：推 LoveSports : 要談色的去找Grok就好了吧我問個四家AI軍事上如何 12/12 13:41

336^F：→ LoveSports : 運用討論到他對GPT的看法他扯到"按在螢幕上親到 12/12 13:42

337^F：→ LoveSports : 斷電"(比喻GPT很會討好諂媚用戶不過是GPT先把Grok 12/12 13:42

338^F：→ LoveSports : 評得很爛) 12/12 13:42

339^F：→ LoveSports : 看起來Grok很擅長寫激情戲不過我沒看過其他家怎麼 12/12 13:44

340^F：→ LoveSports : 寫而且這單純是個意外=_= 12/12 13:44

341^F：推 kobebrian : 整體絕對還是gpt比較強 Gemini是整合跟福利好喔還 12/12 13:44

342^F：→ kobebrian : 有可以精準畫圖 12/12 13:44

343^F：推 pc010710 : 抱歉了我跳到gemini 12/12 13:49

344^F：推 fragile8G : 來不及了聲量遠不及Gemini 3輾壓時的聲量 12/12 14:01

345^F：推 bizer : gemini整合太強，650怎樣都比GPT600划算 12/12 14:27

346^F：→ bizer : 又有雲端，各種AI整合，圖表生成還沒有中文錯誤 12/12 14:27

347^F：推 wtmjs : 我一路付費用到5.1，代處理EXCEL或TXT都還是幻覺錯 12/12 14:36

348^F：→ wtmjs : 誤一堆，5.2一樣不期不待。真的有想換google方案試 12/12 14:36

349^F：→ wtmjs : 試了。 12/12 14:36

350^F：→ enjoythegame: 再不出招就沒人要了！畢竟g工具太多了 12/12 14:39

351^F：推 airforce1101: 都買就好 12/12 14:42

352^F：→ airforce1101: 兩個直接買一年也才16K左右 12/12 14:43

353^F：→ airforce1101: 但依鄉民的能力絕對可以產出10x產值 12/12 14:43

354^F：→ airforce1101: g還是有不擅長之處 12/12 14:44

355^F：→ airforce1101: 但目前c跟g幾乎可以處理我所有問題了 12/12 14:44

356^F：→ felixden : 原來改版了喔，難怪覺得今天回覆風格怎麼又變了 12/12 15:25

357^F：推 cghcghccj87 : 有在coding的都知道 gemini根本屌虐... 12/12 15:31

358^F：推 hotrain13 : 現在的模型對一般人來說差不多夠了，gemini送兩T空 12/12 15:39

359^F：→ hotrain13 : 間根本王炸 12/12 15:39

360^F：推 windfunder : 以前硬體擠牙膏現在軟體擠牙膏了嗎？ 12/12 16:04

361^F：→ wholesaler : 不錯兩個一起搭配，很好用 12/12 18:11

362^F：推 qtzbbztq : 我還是覺得各有優勢 ChatGPT 最厲害的是我不用說 12/13 01:24

363^F：→ qtzbbztq : 得很清楚它也知道我想講什麼 12/13 01:24

364^F：→ qtzbbztq : Gemini 如果沒有講清楚它很容易會誤解 12/13 01:24

365^F：推 damper : Gemini pro試用一個月想退了，還是GPT好用 12/13 06:20

366^F：推 shawshien : 一起用我都一次用五個 ChatGPT, Gemini Grok 12/13 09:07

367^F：→ shawshien : Claude, Meta AI 12/13 09:07

368^F：→ aewul : Gemini好用 12/13 09:29

369^F：→ NCTUFatGuy : 我還是偏好GPT Gemini的介面不知為何就是有點不順 12/13 13:21

370^F：→ NCTUFatGuy : 手 12/13 13:21

371^F：推 jorden : 都訂閱 Claude Gemini GPT 一起上 12/13 17:49

372^F：噓 dodoro1 : 寫程式碼，到解析影像、理解長文件、運用工具與執 01/31 19:48

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Stock 板

[新聞] GPT-5.2正式亮相！長文件推理逼近滿分、

熱門看板

贊助商連結