作者jeff0025 (無法顯示人物名稱)
看板Stock
標題[新聞] GPT-5.2正式亮相!長文件推理逼近滿分、
時間Fri Dec 12 08:33:50 2025
原文標題: GPT-5.2正式亮相!長文件推理逼近滿分、企業應用大進化
原文連結:
https://ai.ettoday.net/news/3082692
發布時間: 2025年12月12日 06:09
記者署名: 吳立言
原文內容:
OpenAI 今(12日)正式推出全新一代模型 GPT-5.2,主打專業知識工作、長任務代理(
agentic workflows)與複雜專案處理能力。
OpenAI 表示,GPT-5.2 是目前最強大的模型
系列,包含 Instant、Thinking 與 Pro 三種版本,將率先於 ChatGPT 付費用戶陸續開
放,本日同步於 API 全面上線。
OpenAI 指出,GPT-5.2 的設計目標是協助專業人士提升效率,從製作試算表、簡報、撰
寫程式碼,到解析影像、理解長文件、運用工具與執行多步驟任務。根據官方數據,一般
企業戶平均每天可節省 40~60 分鐘,重度用戶甚至可省下每周10 小時以上。
GPT-5.2 Thinking 在多項專業與推理評測創下新高,其中包含:
GDPval(知識工作評測):在 44 種職業任務測試中,GPT-5.2 Thinking 與產業專家相
比 70.9% 達到平手或勝出,首次達到「整體專家級表現」。
程式能力:在 SWE-Bench Pro 實際軟體工程測試中達到 55.6% 正確率,刷新既有紀錄。
SWE-bench Verified(Python):提升至 80%。
高難度數學 FrontierMath(Tier 1–3):提升至 40.3%,為新 SOTA(state of the
art)。
AIME 2025(競賽數學):達到罕見的 100%。
這代表該模型在真實世界的工作流程中,更能自主偵錯、完成功能開發、重構大型程式碼
庫及協助工程團隊提升開發速度。
GPT-5.2 在多項核心能力上也明顯提升。首先,長上下文推理表現突破新高,在 OpenAI
MRCRv2 測試中,模型於 256k tokens 的 4-needle 任務中接近 100% 準確率,特別是在
128k~256k 範圍仍維持高度穩定,意味著能更可靠處理動輒數十萬字的合約、研究論文
與大型專案文件。
視覺理解方面同樣強化,GPT-5.2 Thinking 在科學圖表辨識(CharXiv)中的錯誤率約減
半,在專業介面理解(ScreenSpot-Pro)更大幅領先前代,使其更適用於金融、營運、工
程與設計等高度依賴視覺資訊的領域。工具調用能力則刷新紀錄,在 τ2-bench
Telecom 多輪任務中成功率達 98.7%,能更完整處理跨步驟流程,例如客服案件、資料擷
取與一條龍分析生成。
至於科研能力,GPT-5.2 在 GPQA Diamond 高難度理科題目中也取得 92~93% 的高分,
OpenAI 稱已有研究團隊在其協助下於統計學問題上產生具研究價值的證明,並經外部專
家驗證,展現其在科學與數學研究上的實質潛力。
API 定價部分,GPT-5.2 為每百萬字元 1.75 美元(輸入)與 14 美元(輸出),
GPT-5.2 Pro 則為每百萬字元 21 美元(輸入)與 168 美元(輸出)。OpenAI 表示,雖
然 GPT-5.2 單位成本較高,但由於模型在推理效率與生成品質上更精準,實際完成同等
品質任務所需的總成本反而有機會降低。GPT-5.2 提供三個版本:
Instant:快速、涵蓋大多數日常任務
Thinking:適合深度推理、文件分析、程式碼與大專案
Pro:最強版本,適合困難領域與最高品質需求
OpenAI 表示 GPT-5.2 整體輸出更一致、有條理,並針對敏感內容(心理健康、自傷訊息
等)加強安全應答。ChatGPT Plus/Pro/Business/Enterprise 今日起陸續開放,
GPT-5.1 將在三個月後從 ChatGPT 中下架(API 不受影響)。
心得/評論:
已反應? 這次發布後好像沒啥人在意 AI真的要泡沫化了嗎?
感覺OpenAI一直強調多強好像對一般使用者來說根本無感
Gemini有完整生態系 還送2TB雲端空間 又能一個人購買多人共享
然後生成圖片又強
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1765499634.A.473.html
1F:推 Tohkachan : gemini 便宜又大碗 12/12 08:35
2F:推 MorikonHase : gemini 不後悔中 12/12 08:35
3F:推 Muilie : 瑟瑟呢! 奧特曼也唬爛嘴! 12/12 08:36
4F:→ zzzzzzzzzzzy: 沒用了,永遠被gemini踩在腳下摩擦 12/12 08:36
5F:推 lawyer94 : 話說grok被蛋雕了嗎 12/12 08:37
6F:推 js01078687 : 競爭對消費者是好事 12/12 08:37
7F:推 ackes : 一般人用不到的關係吧 通常都只是查查東西 畫畫圖 12/12 08:37
8F:推 rxsmalllove : 抱歉 估狗也會下去 12/12 08:37
9F:推 sssallen : 不錯喔 12/12 08:38
10F:推 ben121196 : 這邊一片看衰 那我知道穩不穩了 12/12 08:39
11F:→ mamorui : 圖咧! 菇菇當初訂閱歐噴醬是為了圖! 12/12 08:39
12F:推 qqtab : 谷歌被吹到獨自跳水 12/12 08:42
13F:推 kuosos520 : grok蠻好用的呀 12/12 08:42
14F:→ agoo : gpt 比較好用 12/12 08:42
15F:→ b9513227 : gemini根本弱智 速度慢 又常常a問題完了問b問題跟 12/12 08:43
16F:→ b9513227 : 我講a問題 12/12 08:43
17F:推 tamama000 : 記者可以去 了 12/12 08:43
18F:推 fhjqwefs : 持續競爭是好事 台股3W6就靠鏟子商cc 12/12 08:43
19F:→ tamama000 : 隨時被取代 12/12 08:43
20F:推 Phineas2635 : 繼續吹 12/12 08:44
21F:推 HiuAnOP : 瑟瑟Ai呢?沒有就掰掰 12/12 08:44
22F:→ tctv2002 : 繼續競爭 鏟子供應鏈發大財 12/12 08:44
23F:→ tctv2002 : 等他們不競爭 台灣就走向日本失落20年 12/12 08:44
25F:→ idernest : 好了啦 奧特曼 12/12 08:45
26F:推 ABC610478 : 因為有對手了 12/12 08:45
27F:推 YumingHuang : GPT-99.9出的時候叫我、謝謝 12/12 08:45
28F:→ LoveSports : 加強後訓練之後各家最新模型ARC-AGI-2高達50幾趴 12/12 08:46
29F:→ LoveSports : 同一個類神經網路透過後訓練加強能力 12/12 08:46
30F:→ YumingHuang : Grok走即時資訊串流鏈的樣子? 12/12 08:46
31F:推 karta018 : 不用吹,拿幾題測試下去就知道了,上次gemini是真的 12/12 08:46
32F:→ karta018 : 拉開差距 12/12 08:46
33F:推 smallkop : 真的厲害就不用自己發新聞了 12/12 08:47
34F:→ LoveSports : 代表預訓練難以再突破 不用推出GPT6就能有大幅進步 12/12 08:47
35F:→ LoveSports : 美國比較多企業用戶 已經用習慣GPT不會輕易換Gemini 12/12 08:48
36F:→ LoveSports : OPEN AI得為了那些企業用戶趕上差距 12/12 08:49
37F:推 jinxinmypant: 晚了就不要了 12/12 08:49
38F:推 andy79323 : 過幾天開源的要發新模型 12/12 08:49
39F:→ appledick : 現在其實已經很夠一般人使用了阿....算力過剩了 12/12 08:50
40F:→ LoveSports : 這篇增強能力都是專業用途的,這個方向是對的 12/12 08:50
41F:噓 strlen : 現在AI評測早就不重要的 喜歡哪個AI全都是靠感覺 12/12 08:50
42F:→ LoveSports : 光靠閒聊談限制級無法留住那些企業用戶 12/12 08:50
43F:→ appledick : AI現在的問題是 同時有巨量的人使用才會有問題..... 12/12 08:50
44F:→ strlen : 就跟智慧手機差不多 哪一牌的旗艦機功能幾乎一樣 12/12 08:50
45F:→ strlen : 看硬體跑分也是看爽的 實際上打遊戲幾乎沒差別 12/12 08:51
46F:→ strlen : 什麼Gemini比較好 Grok比較強 GPT更人性 都是感覺 12/12 08:51
47F:→ strlen : 真叫你說差在哪 你也說不出來差別啦 笑死 12/12 08:52
48F:→ appledick : 現在是看那些應用可以拿AI拿來重大突破才有意義 12/12 08:52
49F:→ luche : grok的語文意義掌握好像與其他家不同 覺得特別強 12/12 08:53
50F:→ appledick : 不然前陣子G奶夯的時候 去用GTP順到炸 12/12 08:54
51F:推 LoveSports : 我前陣子丟六篇不同長文給各家AI分析 Gemini 3.0沒 12/12 08:54
52F:→ strlen : 上次看OpenRouter報告 AI現在就兩大剛需應用 這是付 12/12 08:54
53F:→ LoveSports : 有搞錯六篇分別的作者 (六個作者有回來回去) 12/12 08:54
54F:→ strlen : 費慾望最強烈的 1.聊天打屁 2.寫程式 沒了 12/12 08:54
55F:→ LoveSports : GPT5.1跟Grok4都混淆 12/12 08:54
56F:推 fhjqwefs : 重大突破沒意義 能省更多人力訂閱越划算產生盈餘才 12/12 08:54
57F:→ fhjqwefs : 有意義 12/12 08:54
58F:→ strlen : 其它需求和用量遠遠比不上聊天跟寫程式 12/12 08:54
59F:推 deann : 打開還是5.1版阿 12/12 08:55
60F:→ strlen : LLM公司要真聰明 就該衝這兩個就好 尤其是寫程式 12/12 08:55
61F:噓 OxFFFF : 工作及生活交叉使用比對後,覺得chatGPT 最廢最藏 12/12 08:55
62F:→ LoveSports : 專業用途的企業用戶也很重要,評測結果影響投資 12/12 08:55
63F:推 FOREVER49KG : 好 12/12 08:55
64F:推 deathoflove : 真的企業用的話 某些比較保守的產業會優先用M軟cop 12/12 08:55
65F:→ deathoflove : ilot 對 很爛 但誰叫他是M軟 內部DD做起來無慮 12/12 08:55
66F:推 goodevening : ai總結文章影片跟財報很不錯阿,我就是因為這樣買ge 12/12 08:55
67F:→ goodevening : mini 12/12 08:55
68F:推 leo850319 : image gen呢 被谷歌打到不做了? 12/12 08:56
69F:推 DogEggz : gork色色一統天下 12/12 08:56
70F:推 flash789 : 只剩瑟瑟能夠救得了cpt了 12/12 08:56
71F:噓 sssallen : G除了玩圖有比較厲害? 12/12 08:57
72F:推 rxsmalllove : 我是覺得AI準確性和安全性再提高一般企業就會是消費 12/12 08:57
73F:→ rxsmalllove : 主力了 12/12 08:57
74F:→ appledick : G玩圖下的指令要很清楚 GTP反而不用 12/12 08:58
75F:→ appledick : 這就是為啥大家說GTP比較人性 用很白話的方式就可以 12/12 08:58
76F:推 LoveSports : 那些AI工程師的夢想是要AI解決人類困境 所以企業或 12/12 08:59
77F:→ LoveSports : 研究方面用途絕對是他們前進的目標之一 12/12 09:00
78F:→ LoveSports : 不能單純看到一堆人在玩角色扮演談色情就限制框架 12/12 09:00
79F:→ LoveSports : 很多人就著重閒聊就好,矛盾的是又會被批只能聊天 12/12 09:01
80F:推 Vincent8026 : 道德限制還是很硬 12/12 09:02
81F:→ LoveSports : 很多人說著重聊天就好,意思是認定模型只能當笨蛋 12/12 09:02
82F:→ LoveSports : 給人類當聊天陪伴對象或性奴就好,這種觀念太狹隘了 12/12 09:03
83F:推 rxsmalllove : OAI有在跟消費者端的企業合作啊 只是不成功變成仁? 12/12 09:03
84F:推 jerrychuang : 可以做ppt嗎? 12/12 09:03
85F:推 ikachann : GPT比較好用+1 12/12 09:04
86F:→ ikachann : 一樣的指令下去 GPT產出的明顯比Gemini的完整且正確 12/12 09:05
87F:→ miss32 : 是大量跳槽gemini嗎 最近gemini速度變好慢 12/12 09:05
88F:推 puppy20308 : 難怪蘋果不跳下來競爭,太激烈了,等你們打完最後 12/12 09:06
89F:→ puppy20308 : 再來收割 12/12 09:06
90F:推 decorum : AI讓我放棄出家庭作業給學生的做法 評量都回歸測驗 12/12 09:07
91F:→ decorum : 過去最重視的期末報告都免了 因為作者八成是AI 12/12 09:08
92F:推 mynumber55 : Gemini 最近跟屎一樣 12/12 09:09
93F:推 linch416 : google生態系根本無敵 12/12 09:11
94F:→ decorum : 學位論文還是不能免 得花許多力氣查驗 真的很討厭 12/12 09:12
95F:推 aqlec : 哪款可以色色? 12/12 09:12
96F:推 snowdraught : 跑一張圖片太久了 12/12 09:12
97F:→ terry955048 : 碼農快被消滅了..... 12/12 09:13
98F:→ decorum : 又不能禁用 因為畢業出去 運用AI是基本謀生技能 12/12 09:13
99F:推 doubi : 不知道為啥,這次不是很在意,懶得測 ... 有點麻痺 12/12 09:15
100F:→ dslite : 變成一個問題想三分鐘嗎? 12/12 09:16
101F:→ doubi : 其實 Gemini GPT Grok 都差不多能用,生活中確實也 12/12 09:17
102F:→ doubi : 會用,所以選最划算的買 12/12 09:17
103F:→ dslite : Grok答錯率有夠高 還敢嗆我 12/12 09:17
104F:推 liliumeow : 是不是又要買回去了 還是雙棲好了 12/12 09:18
105F:推 ntr203 : 急了 12/12 09:19
106F:推 Fubukichan : Gemini最近用3.0的回答都遠不如5.1的品質跟長度 12/12 09:21
107F:→ dream12305 : GTP是什麼 笑死 12/12 09:22
108F:推 WeiRaymond : Gemini真的強 12/12 09:25
109F:推 guanting886 : Gemini最近應該是一狗票人跳過去 連語音講話的調調 12/12 09:26
110F:→ guanting886 : 都變怪了 12/12 09:26
111F:→ jenchieh5 : gemini回答那個語氣看久了蠻討厭的,就很會幫既有利 12/12 09:28
112F:→ jenchieh5 : 益者粉飾太平的感覺 12/12 09:28
113F:→ guanting886 : GPT5.2強可能反過來想 前面幾代模型都做不到現在做 12/12 09:28
114F:→ guanting886 : 得到 發code red突然就變好了 想必這個模型可能成 12/12 09:28
115F:→ guanting886 : 本不低 12/12 09:28
116F:推 GOOGOOfish : 問題是B2B會比B2C還轉錢嗎? 12/12 09:28
117F:推 chachabo : 不要再害goog了 12/12 09:28
118F:推 doubi : GPT 5.2 的圖片生成好像中文一樣是鬼畫符 12/12 09:29
119F:→ guanting886 : 甜蜜期應該是這一個二個月 後面等大家benchmark跟 12/12 09:29
120F:→ guanting886 : arena打一打可能就慢慢降回去能力了 12/12 09:29
121F:→ doubi : 其實 Gemini 3 會起飛,很大程度是懂中文的關係 12/12 09:29
122F:→ doubi : Banana 還是比較好用 12/12 09:30
123F:→ guanting886 : Google除了學術資料、PDF OCR做很足,還有海量的數 12/12 09:32
124F:→ guanting886 : 據 再配合GA的資料 真要挑高品質的資料去訓練比Op 12/12 09:32
125F:→ guanting886 : enAi還有優勢 12/12 09:32
126F:→ elvaismylove: 這連擠牙膏都不算 12/12 09:32
127F:推 pt993526 : 再訂閱回來 12/12 09:33
128F:推 willion003 : 2TB太邪惡了,還共享 12/12 09:34
129F:推 Sawilliam : 都有付費 用起來grok最鳥 老是忘記之前跟他建好的 12/12 09:35
130F:→ Sawilliam : 規則..回答也一堆錯 但grok對某方面限制條件最少.. 12/12 09:35
131F:推 Lowpapa : 沒人在乎 12/12 09:35
132F:→ bnn : 有反應啊 辜狗又要跳水了 12/12 09:36
133F:推 redbeanbread: 雷曼殺到ai叫媽媽 12/12 09:37
134F:推 guanting886 : Gemini圖裡面的中文做得比較好 就Google的圖資比 12/12 09:37
135F:→ guanting886 : 較多樣、品質也高 這都是擴散模型生的 12/12 09:37
136F:→ guanting886 : OpenAI想要差不多水準就是花錢買別人的 data 12/12 09:38
137F:噓 ryan1220 : 我跳出來又站回去了你打我啊笨蛋 12/12 09:39
138F:→ guanting886 : 但你真的追不上地表最強的爬蟲 12/12 09:39
139F:→ OOorc : 垃圾公司 12/12 09:39
140F:推 mouscat : 反正軍備競賽打越兇 供應鏈都贏 12/12 09:41
141F:推 alsoty : GPT可以語音聊天,其他的好像都還不行? 12/12 09:46
142F:→ hatland86 : 早在幾個月前就退訂GPT用Gemini 但我不覺得是誰超 12/12 09:47
143F:→ hatland86 : 越誰的問題 發展到後面應該是會並行 12/12 09:47
144F:推 gladopo : 可以色色嗎 12/12 09:48
145F:推 ilovebig99 : 最近Gemini 根本就連不上,好幾次一個問半天沒回應 12/12 09:49
146F:→ ilovebig99 : ,還是回去用ChatGPT 了,ChatGPT 都回玩了,Gemini 12/12 09:49
147F:→ ilovebig99 : 還在那邊轉啊轉。 12/12 09:49
148F:→ csy0922 : Notebooklm跟Nanobanana以外的Gemini就是一坨 一堆 12/12 09:49
149F:→ csy0922 : 有的沒的幻覺下指令這樣繼續瞎掰 12/12 09:49
150F:推 shrimprock : AI模型看來沒護城河 生態系才有 谷歌勝 12/12 09:50
151F:推 hotlatte : 開始小米化了 12/12 09:51
152F:推 yulun1984 : 免費仔用G 12/12 09:51
153F:推 mynumber55 : 很簡單啊,算力根本不夠 12/12 09:52
154F:→ yunf : 不要再吹openai啦我知道他很厲害 你不會出 gemini的 12/12 09:53
155F:→ yunf : 比較喔 12/12 09:53
156F:→ strlen : NanoBanana另一個點是 為什麼可以無視版權生角色圖 12/12 09:54
157F:→ strlen : GPT弄個吉卜力 只是風格 就被臭幹 12/12 09:54
158F:→ strlen : Banana是可以直接生鬼滅 吉伊卡哇 角色 12/12 09:55
159F:推 BBKOX : 戰國時代不要只壓一邊 12/12 09:55
160F:推 bornwinner : 能自己更新程式碼再說 12/12 09:56
161F:→ strlen : 然後沒人在乎狗家侵權?還是巨頭蛇麼都可以 12/12 09:56
162F:推 Sean0211 : 現在目標是AI取代投顧 那就真的神了 12/12 09:57
163F:推 linleex : agi已經實現了 12/12 09:59
164F:→ yunf : 投顧轉型用ai好嗎 12/12 10:00
165F:推 heybro : 估狗屌打 12/12 10:00
166F:推 as6633208 : 猛 屌打Gemini 3 12/12 10:04
167F:推 shrimprock : 跟瀏覽器大戰一樣 最後贏不是誰強 而是誰有作業系 12/12 10:04
168F:→ shrimprock : 統 12/12 10:04
169F:→ BBKOX : 作業系統就windows 12/12 10:05
170F:→ as6633208 : 錯,現階段AI比的就是誰答案好,因為現階段AI還會犯 12/12 10:07
171F:→ as6633208 : 傻有瓶頸,遠遠還沒到大家都一樣好比得是應用的階段 12/12 10:07
172F:推 opticalman : 看來分歧,互有支持者,表示gpt gemini grok 差不 12/12 10:08
173F:→ opticalman : 多就這樣了,很難落差很大 12/12 10:08
174F:→ rxsmalllove : 你在看哪 落差很大 只是各有優勢 12/12 10:09
175F:推 andboypig : 剛剛問了本人 5.2還沒發佈 12/12 10:09
176F:→ mouscat : grok沒辦法跟這兩個比吧 12/12 10:09
177F:推 SuiseiTrain : 反殺 12/12 10:10
178F:推 as6633208 : 屌打Gemini 3 12/12 10:11
179F:推 tsubasawolfy: 5.2付費用戶已經上了 12/12 10:12
180F:推 opticalman : got deepseek Gemini gork gpt ....未來還有很多新 12/12 10:16
181F:→ opticalman : 人橫空出世啦,水平會越拉越近,很難獨強 12/12 10:16
182F:推 kakar0to : 被google生態系屌打 chatgpt這個穴已經沒用了 12/12 10:16
183F:推 kenslc199 : 人多的地方不要去 包含AI cc 12/12 10:17
184F:推 Jeff1989 : 逼一逼還是能發揮潛能的 12/12 10:19
185F:→ as6633208 : m365 copilot 就是一個例子,生態系比google還廣, 12/12 10:21
186F:→ as6633208 : 但就是不好用,模型答案準確答案好才是重點,空有生 12/12 10:21
187F:→ as6633208 : 態系沒屌用,模型夠強生態系反而小事 12/12 10:21
188F:推 opticalman : 大家手上都有老黃的gpu,人人都有機會針對缺點優勢 12/12 10:23
189F:→ opticalman : 去改善和挑戰領先者 12/12 10:23
190F:→ bnn : 模型大家都還在改進啊 這次gpt不就demo搞投影片生成 12/12 10:23
191F:→ bnn : 自動做試算表這些功能 之前就沒訓練 還是LLM對話 12/12 10:24
192F:→ bnn : 然後之前claude則是先著重代碼生成 每家方針不同 12/12 10:25
193F:推 breathair : 誰強點,誰弱點不重要,都差不多,沒有拉開代差,比 12/12 10:27
194F:→ breathair : 氣長誰都知道誰會死,每個人都知道的話就是死亡螺旋 12/12 10:27
195F:推 mikuyoyo : 有在用都知道gpt回答屌打全部,gemini 只是功能比較 12/12 10:27
196F:→ mikuyoyo : 多和能跟Google整合而已 12/12 10:27
197F:推 as6633208 : 笑死 就是因為這條賽道打不贏,才會扯到外部生態系 12/12 10:28
198F:→ as6633208 : ,誰錢多氣長 12/12 10:28
199F:→ mouscat : 我覺得Gemini 的回答方式比較好懂啦 12/12 10:28
200F:→ as6633208 : 就是輸人才一直扯外部找藉口 12/12 10:29
201F:→ as6633208 : 超好笑 12/12 10:29
202F:→ mouscat : Google是反NVDA大聯盟那邊的吧 用AVGO晶片 12/12 10:31
203F:推 breathair : 谷歌是打防守,跟進攻方的難度不是一樣的 12/12 10:34
204F:推 yogofresh : 太貴了。有些問題我問DeepSeek反而能得到更好的回答 12/12 10:34
205F:推 salamender : 有競爭才是好事,chatgpt還是有優點阿 12/12 10:41
206F:→ shirleyEchi : 讓他來分析舊金山和約寫了什麼 12/12 10:43
207F:推 kogsww : 來不及了 已退訂 12/12 10:43
208F:推 OhmaZiO : 5.2 也沒用 還不是繼續說謊+詭辯+道歉 12/12 10:44
209F:噓 rumblefish : AI不要再搶辦公室工作了 12/12 10:46
210F:→ orz811017 : 現在就是反狗家聯軍進攻的回合 12/12 10:49
211F:→ orz811017 : 六大教派圍攻光明頂 12/12 10:49
212F:推 jboys75 : 每次都吹的很強 結果…這次觀望一下 12/12 10:49
213F:推 max117980 : ChatGPT 政策一大堆 這個不行那個不行 前陣子會兩邊 12/12 10:49
214F:→ max117980 : 都貼對比一下答案 真的還是Gemini 比較強 已經好幾 12/12 10:49
215F:→ max117980 : 天沒用GPT了 12/12 10:49
216F:推 kakalin : 感覺各個AI專精不同領域也是不錯的分工 12/12 10:51
217F:推 breathair : AI現在ToB各有各的強項 本來就三大公雲,誰也沒有制 12/12 10:56
218F:→ breathair : 霸,會一直一直一直競爭下去。ToC要顛覆谷歌的廣告 12/12 10:56
219F:→ breathair : ,短時間就沒戲,除非有人先想好了怎麼讓消費者接受 12/12 10:56
220F:→ breathair : AI灌給你廣告再來談 12/12 10:56
221F:→ j32072 : 不能做瑟圖我不會買單的 12/12 10:58
※ error405:轉錄至看板 AI_Art 12/12 10:59
222F:推 as6633208 : gpt一直努力保持道德中立,哪天gpt也像grok 一樣混 12/12 11:06
223F:→ as6633208 : 亂邪惡就進化了 12/12 11:06
224F:→ BBKOX : 博通夜盤怎麼了 12/12 11:09
225F:→ searchroy : Google 還沒出手,open 醬亂成一團 12/12 11:10
226F:推 SapiensChang: gemini絕對屌打gpt啦 不管寫coding和資料正確性 有g 12/12 11:12
227F:→ SapiensChang: oogle搜尋結果比對 正確性遠大於gpt 12/12 11:12
228F:推 DrowningPool: 推理還是GPT贏 gemini光記憶力就跟智障一樣 12/12 11:14
229F:→ SapiensChang: gpt到底有什麼強項?每項測試下來gpt都被碾壓 你說g 12/12 11:15
230F:→ SapiensChang: rok還有強項 gpt coding跑出來八成根本還要再debug 12/12 11:15
231F:→ SapiensChang: 就claude和gemini幾乎都很正確 12/12 11:15
232F:推 as6633208 : 同樣題目gpt 5.2 答案明顯比Gemini 3 pro更嚴謹,看 12/12 11:17
233F:→ as6633208 : 不出所謂搜索之後答案更正確,要是這樣在測試跑分應 12/12 11:17
234F:→ as6633208 : 該也贏gpt,而不是gpt全面碾壓評測 12/12 11:17
235F:推 rxsmalllove : Gemini有幾乎都很正確?忍不住懷疑 12/12 11:18
236F:推 SapiensChang: gemini每個對話的token是gpt的10倍 記憶力正確但都 12/12 11:19
237F:→ SapiensChang: 答不對的ai 和能撐超久的短時記憶 gemini還是好用很 12/12 11:19
238F:→ SapiensChang: 多 我每天都在用gpt plus和gemini pro 前面那個才是 12/12 11:19
239F:→ SapiensChang: 很常給出智障答案…很受不了 12/12 11:19
240F:推 yuchifan : 我比你強,我比你更強,幹比不完 12/12 11:19
241F:推 rxsmalllove : 我目前使用心得相反 pro 的答案比Gpt更需要更正 12/12 11:22
242F:→ SapiensChang: Gemini都很正確啊 前陣子才把公司的EDA驗證flow靠ge 12/12 11:23
243F:→ SapiensChang: mini和claude建立起來 chatgpt只會產出很多資訊垃圾 12/12 11:23
244F:→ SapiensChang: 生活上就出國排行程 搜索期刊 gpt只會給你一些不存 12/12 11:24
245F:→ SapiensChang: 在的期刊 不存在的景點 12/12 11:24
246F:→ SapiensChang: 自從gemini pro 3.0幾乎就沒看它犯蠢過 頂多送了跳 12/12 11:25
247F:→ SapiensChang: 針一下 12/12 11:25
248F:推 as6633208 : 架構規劃和研究gpt明顯更適合,Claude更適合執行,G 12/12 11:26
249F:→ as6633208 : emini +Claude ,還不如gpt+Claude 12/12 11:26
250F:推 Sunny821210 : Gemini醫學的問題問深一點會打錯 GPT反而答對 最近 12/12 11:26
251F:→ Sunny821210 : 的使用心得 12/12 11:26
252F:推 DrowningPool: 某人的使用心得怎麼都跟我完全相反 ccc 12/12 11:28
253F:推 rxsmalllove : 那我覺得應該是擅長領域不同吧 我在用的是財務 12/12 11:28
254F:推 mouscat : Gemini給我的感覺是「更會講人話」適合問一些非專 12/12 11:29
255F:→ mouscat : 業 科普性質問題 12/12 11:29
256F:→ strlen : 那些都不重要 都不會是核心應用 12/12 11:29
257F:→ strlen : 核心就兩個 聊天打屁跟寫程式 自己去看報告 12/12 11:30
258F:→ strlen : 查資料也不會是AI剛需 那個Google就好了誰要付錢 12/12 11:30
259F:推 rxsmalllove : 核心擴展不了 現在的股價都是高估 12/12 11:32
260F:→ SapiensChang: 可能真的是領域不同 我是科技業啦 12/12 11:32
261F:推 as6633208 : 重點是Agent自動化替代勞動力吧,你用tools的觀念沒 12/12 11:34
262F:→ as6633208 : 人用的下去,tools依賴人,老黃說AI is work,要做 12/12 11:34
263F:→ csy0922 : 財務相關的Geimni真的滿笨的,財報丟給他、Bloombe 12/12 11:34
264F:→ csy0922 : rg資料庫的資料丟給他,都還會回答錯誤數字或說你 12/12 11:34
265F:→ csy0922 : 的資料來源才是錯的 12/12 11:34
266F:→ as6633208 : 成agent 那樣取代某個工作,讓那個工作的人只要看一 12/12 11:34
267F:→ as6633208 : 下對不對,這個才是市場,取代勞動力不足,未來你公 12/12 11:34
268F:→ as6633208 : 司擴廠那個agent 勞動力是24hr專注工作+回報,還可 12/12 11:34
269F:→ as6633208 : 以無限加開部署,省去人力成本,增加勞動力才是AI最 12/12 11:34
270F:→ as6633208 : 終目的 12/12 11:34
271F:→ strlen : 那些都是用量極小 對企業基本沒啥重大幫助的東西 12/12 11:35
272F:→ strlen : 輔助型工具 雞助到不行 真正有生產力上質變的 就是 12/12 11:35
273F:→ strlen : coding 完全改變企業效率 12/12 11:35
274F:噓 blackstyles : 不用了謝謝 找個幾千個遊戲的網址都找不出來還不如 12/12 11:35
275F:→ blackstyles : 我自己一個一個複製貼上 真是謝了 12/12 11:35
276F:→ strlen : coding接上去 token花費是天量 這才能賺大錢 12/12 11:36
277F:→ strlen : 那些什麼查資料三洨碗糕 是能吃多少token 12/12 11:36
278F:→ strlen : 量也完全不是寫code能比的 12/12 11:37
279F:推 tsubasawolfy: 哪個年代GPT還會給你不存在的期刊... 12/12 11:43
280F:推 rxsmalllove : 我認同 但我還是認為股價要有未來性AI要對現有工作 12/12 11:43
281F:→ rxsmalllove : 有強大的替代性 12/12 11:43
282F:→ tsubasawolfy: 指定文獻資料庫跟peer review打下去就解決 12/12 11:44
283F:→ tsubasawolfy: 真要說缺點就是一篇可以拿來廢話很多段 12/12 11:45
284F:推 LoveSports : AI AGENT目前在美國模型使用率只有5~7趴 還要很久 12/12 11:49
285F:→ LoveSports : 這次因為OPEN AI因為要打贏Gemini 3.0 pro又暫緩AI 12/12 11:49
286F:→ LoveSports : AGENT那方面的開發了 12/12 11:49
287F:→ LoveSports : 上面那是正式使用的數字 實驗性導入的企業20~25趴 12/12 11:51
288F:推 muya318 : Gemini把服務綁定越深感覺之後就是走相簿養套殺路 12/12 11:52
289F:→ muya318 : 線,你要那些資料就要繼續付錢 12/12 11:52
290F:推 kobebrian : Gemini一直給我錯誤資訊 連不同姓的人都給我說成是 12/12 11:53
291F:→ kobebrian : 兄弟關係… 12/12 11:53
292F:推 tony15899 : 問他周星馳跟周潤發是甚麼關係 12/12 11:57
293F:→ stocktonty : 要噴爛了 12/12 11:59
294F:噓 verydolungbe: 生態系?不就小網民乖乖付錢,是能賺多少?賺得贏微 12/12 12:00
295F:→ verydolungbe: 軟? 12/12 12:00
296F:→ Heedictator : 奧特曼反擊! 12/12 12:01
297F:→ nakinight : GPT丸子 12/12 12:02
298F:→ jickey : 滿分代表以後沒有進步空間了,崩! 12/12 12:03
299F:推 q111175 : Gpt還是比較好用 12/12 12:05
300F:推 vltw5v : 有競爭者才會怕才會進步 很好啊 12/12 12:07
301F:推 NEX4036 : 美股永動機怎麼輸? 12/12 12:07
302F:→ NEX4036 : 估狗炒不動換老黃,老黃炒不動換估狗! 12/12 12:07
303F:推 diefish5566 : gemini問題在上下文注意力一坨 非常快會忘記前文 12/12 12:14
304F:→ diefish5566 : 測試你只問一兩次那當然很強 12/12 12:14
305F:推 sdbb : 謝謝推文 12/12 12:15
306F:推 GWang : AI夠用即可 再來就比生態系 GPT輸到脫褲 12/12 12:18
307F:推 koushimei : Gemini 遇到要大量演算時候的task就會亂講一通 12/12 12:20
308F:→ koushimei : ChatGPT 還是屌打 12/12 12:21
309F:推 salvationist: 說好的開放色色的呢?在那? 12/12 12:21
310F:推 chatbra : AI邊緣運算才是主戰場 12/12 12:21
311F:→ gemm : Gemini現在bug一堆 傳新圖會一直辨識成舊圖 12/12 12:26
312F:推 shyshyan : gpt免費版就限制一堆 一下子就叫你付錢 g奶免費版 12/12 12:26
313F:→ shyshyan : 用起來比較爽 12/12 12:26
315F:→ beavertail97: GPT這功能超好用,不會刪記憶,隨時開開新對話問它 12/12 12:33
316F:→ beavertail97: ,都記得 12/12 12:33
317F:推 kobebrian : Gemini的免費版根本不是給人用的 錯誤太多 12/12 12:33
318F:推 beavertail97: 也有買GEMINI, NOTEBOOKLM實在太好用 12/12 12:35
319F:推 Sawilliam : 之前拿gpt 跟Gemini 同時算筆畫取名 結果gpt 筆畫 12/12 12:37
320F:→ Sawilliam : 都是錯的... 12/12 12:37
321F:推 WSY000000000: 一樣吸金中 12/12 12:40
322F:→ mouscat : 所有說Gemini錯誤多的是有用pro thinking 還是沒有 12/12 12:44
323F:推 ivan761016 : GPT綁微軟才讚 一堆企業用戶都用微軟 怎麼酥 12/12 12:46
324F:→ ivan761016 : 是一般用戶有錢還是企業用戶有錢想也知道 12/12 12:46
325F:→ Kevinkkk52 : 目前體感grok錯誤率最高 12/12 12:47
326F:→ NingK : 結果還是不能色色 12/12 12:49
327F:推 CKRO : 急了 12/12 12:53
328F:推 applejone : Gemini現在伺服器就滿載中 算力不夠 12/12 13:01
329F:→ TGTplayer : 香蕉獨孤求敗 12/12 13:02
330F:→ stocktonty : 瑟瑟只能去GROK 12/12 13:03
331F:推 kingofsdtw : 企業用戶也無法色色... 12/12 13:22
332F:推 duriel3313 : grok, gemini GPT都有買 文字還是GPT最好 12/12 13:24
333F:推 magier : gemini3幻覺很多 12/12 13:31
334F:推 House23 : 關鍵字:付費 12/12 13:36
335F:推 LoveSports : 要談色的去找Grok就好了吧 我問個四家AI軍事上如何 12/12 13:41
336F:→ LoveSports : 運用 討論到他對GPT的看法 他扯到"按在螢幕上親到 12/12 13:42
337F:→ LoveSports : 斷電"(比喻GPT很會討好諂媚用戶 不過是GPT先把Grok 12/12 13:42
338F:→ LoveSports : 評得很爛) 12/12 13:42
339F:→ LoveSports : 看起來Grok很擅長寫激情戲 不過我沒看過其他家怎麼 12/12 13:44
340F:→ LoveSports : 寫 而且這單純是個意外=_= 12/12 13:44
341F:推 kobebrian : 整體絕對還是gpt比較強 Gemini是整合跟福利好 喔還 12/12 13:44
342F:→ kobebrian : 有可以精準畫圖 12/12 13:44
343F:推 pc010710 : 抱歉了我跳到gemini 12/12 13:49
344F:推 fragile8G : 來不及了 聲量遠不及Gemini 3輾壓時的聲量 12/12 14:01
345F:推 bizer : gemini整合太強,650怎樣都比GPT600划算 12/12 14:27
346F:→ bizer : 又有雲端,各種AI整合,圖表生成還沒有中文錯誤 12/12 14:27
347F:推 wtmjs : 我一路付費用到5.1,代處理EXCEL或TXT都還是幻覺錯 12/12 14:36
348F:→ wtmjs : 誤一堆,5.2一樣不期不待。真的有想換google方案試 12/12 14:36
349F:→ wtmjs : 試了。 12/12 14:36
350F:→ enjoythegame: 再不出招就沒人要了!畢竟g工具太多了 12/12 14:39
351F:推 airforce1101: 都買就好 12/12 14:42
352F:→ airforce1101: 兩個直接買一年也才16K左右 12/12 14:43
353F:→ airforce1101: 但依鄉民的能力絕對可以產出10x產值 12/12 14:43
354F:→ airforce1101: g還是有不擅長之處 12/12 14:44
355F:→ airforce1101: 但目前c跟g幾乎可以處理我所有問題了 12/12 14:44
356F:→ felixden : 原來改版了喔,難怪覺得今天回覆風格怎麼又變了 12/12 15:25
357F:推 cghcghccj87 : 有在coding的都知道 gemini根本屌虐... 12/12 15:31
358F:推 hotrain13 : 現在的模型對一般人來說差不多夠了,gemini送兩T空 12/12 15:39
359F:→ hotrain13 : 間根本王炸 12/12 15:39
360F:推 windfunder : 以前硬體擠牙膏現在軟體擠牙膏了嗎? 12/12 16:04
361F:→ wholesaler : 不錯 兩個一起搭配,很好用 12/12 18:11
362F:推 qtzbbztq : 我還是覺得各有優勢 ChatGPT 最厲害的是 我不用說 12/13 01:24
363F:→ qtzbbztq : 得很清楚它也知道我想講什麼 12/13 01:24
364F:→ qtzbbztq : Gemini 如果沒有講清楚 它很容易會誤解 12/13 01:24
365F:推 damper : Gemini pro試用一個月想退了,還是GPT好用 12/13 06:20
366F:推 shawshien : 一起用 我都一次用五個 ChatGPT, Gemini Grok 12/13 09:07
367F:→ shawshien : Claude, Meta AI 12/13 09:07
368F:→ aewul : Gemini好用 12/13 09:29
369F:→ NCTUFatGuy : 我還是偏好GPT Gemini的介面不知為何就是有點不順 12/13 13:21
370F:→ NCTUFatGuy : 手 12/13 13:21
371F:推 jorden : 都訂閱 Claude Gemini GPT 一起上 12/13 17:49