作者stonys (蝶戀影)
看板Gossiping
標題[問卦] Gemini是不是過譽了?
時間Sun Nov 30 15:22:09 2025
昨天心血來潮
問了Gemini Pro3 付費版一個10*10的數蛇題
結果他老兄想了老半天
給出了一堆錯誤答案
要嘛數字重複出現
要嘛數字沒有連續出現直接跳格
然後我把同樣的題目丟給免費ChatGPT
ChatGPT才花了1分17秒就給了一個正確解答
我先驗算過後覺得沒問題
再丟回給Gemini叫他驗算
他就說這答案完全正確
https://meee.com.tw/X0KUQ2c
接著我就告訴他,這是我用免費ChatGPT得到的答案
人家免費版才花了1分17秒就回答出來
你是付費的PRO版,怎麼都算不出來,是不是很廢
然後他就開始講一堆理由
一下子說人家ChatGPT是依靠後端的VM直接執行程式碼
他因為權限關係無法做這樣的運算
一下又說給我程式碼
叫我用線上Python網頁程式去執行,一定可以得出結果
我就照他說的,去問了ChatGPT是否有在背景執行VM的權限
人家說他沒有,單純用邏輯推導得到結果的
再用他的程式碼到線上Python網頁程式去執行
結果直接卡死
我就罵Gemini根本是又愛騙又廢
最終他也承認我罵得很對
https://meee.com.tw/kBoxdiK
所以說,Gemini是不是過譽了呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.173.218 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Gossiping/M.1764487332.A.E25.html
2F:推 joshddd: 你用錯模型了 = = gemini 3 pro 你可能 101.8.128.170 11/30 15:24
3F:→ joshddd: 用的是盜版 101.8.128.170 11/30 15:25
4F:→ Gamblers5566: GPT也常常騙我 其實就半斤八兩 49.217.235.141 11/30 15:25
5F:推 kabukiryu: 就莫名奇妙忽然出現1堆像業配der文, 118.233.1.45 11/30 15:25
6F:→ kabukiryu: 網路上鋪天蓋地帶風向der感覺。 118.233.1.45 11/30 15:25
7F:→ ArSaBuLu: 誠摯照燒雞 101.12.128.160 11/30 15:26
8F:→ ICEN: 到底有什麼需求要一直問東問西 39.14.48.162 11/30 15:26
9F:推 citizen5566: 沒有gpt好用 61.222.214.159 11/30 15:27
10F:推 curist: 樓下愛運動 61.228.118.252 11/30 15:29
11F:推 firetim: AI目前比較適合有背景的人拿來做補助工 223.137.152.7 11/30 15:30
12F:→ firetim: 具用,不是所有人適用。沒能力判別錯誤 223.137.152.7 11/30 15:30
13F:→ firetim: 的用下去根本糟 223.137.152.7 11/30 15:30
14F:推 LoveSports: 題目貼一下 我幫你問我的帳號 45.250.255.18 11/30 15:31
15F:→ LoveSports: 我自己是每一家都會問 沒特別捧哪家 45.250.255.18 11/30 15:31
16F:推 dpoiuking: gemini 3 不管有沒有pro都會節省算力 49.215.56.83 11/30 15:32
17F:→ dpoiuking: 用資料庫的,除非妳prompts強調資料庫 49.215.56.83 11/30 15:32
18F:→ dpoiuking: 可能會出錯,要調用python,並且用鏈式 49.215.56.83 11/30 15:32
19F:→ dpoiuking: 回答驗算才會對,不過數學問題問llm是 49.215.56.83 11/30 15:32
20F:→ dpoiuking: 真的有點怪 49.215.56.83 11/30 15:32
21F:噓 lmu0837: gemini很固執又愛跟我懟,老子不喜歡 27.247.2.232 11/30 15:34
22F:推 cccwahaha: 其實多點人這樣問跟驗證才好 36.226.115.164 11/30 15:36
23F:推 camerara: 還好我都蹭免費的 123.193.30.27 11/30 15:37
24F:推 LoveSports: 你第一張截圖有一個比較特別的是有拉 146.70.31.61 11/30 15:37
25F:→ LoveSports: 炮圖示 如果進入角色扮演會比較難算 146.70.31.61 11/30 15:37
因為我一開始有下"你現在是一個專業的數學老師,協助我解答數學問題"
所以不要下這段角色扮演指令會算得比較好嗎?
我在ChatGPT也有下這段扮演提示詞
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 15:39:52
26F:→ TaiwanUp: 有時候改成英文問又會變好 算力不足問題 119.14.30.29 11/30 15:41
27F:→ NinJa: 根本超級過譽... 219.71.221.94 11/30 15:50
28F:推 k798976869: 數學找特化模型 不要找通用的 123.110.50.249 11/30 15:51
29F:→ k798976869: 因為那些數學算法都早就有函式庫能呼 123.110.50.249 11/30 15:52
30F:→ k798976869: 叫百分百不會錯 123.110.50.249 11/30 15:52
31F:→ cardreader: gpt的分析比較比grok3爛超多的,googl 42.79.28.5 11/30 15:55
32F:→ cardreader: e的用很少的關鍵字就可以知道我在問什 42.79.28.5 11/30 15:55
33F:→ cardreader: 麼 42.79.28.5 11/30 15:55
34F:推 KDGC: AI後台回覆的印度人品質參差不齊啦 要看運氣111.241.119.185 11/30 15:56
35F:推 LoveSports: 角色扮演數學老師應該沒差而且更強 146.70.31.61 11/30 15:58
36F:推 skyringcha: 我的chatgpt才是廢物欸 還且常常一本 49.216.172.199 11/30 15:58
37F:→ skyringcha: 正經胡說八道 49.216.172.199 11/30 15:58
38F:→ LoveSports: 我剛丟給GPT他自動進入thinking 3m50s 146.70.31.61 11/30 15:59
39F:→ LoveSports: 他說他無法手算 還說說能手算的是亂答 146.70.31.61 11/30 16:00
40F:→ LoveSports: 跟Gemini 3.0pro一樣叫我用python算 146.70.31.61 11/30 16:00
41F:→ LoveSports: 他說即使他用python也沒辦法 146.70.31.61 11/30 16:00
那就是我的GPT真的比較聰明了
https://meee.com.tw/yyZ35xQ
42F:推 gogolct: grok才是唬爛王吧 27.242.162.231 11/30 16:01
我不許你這樣說Grok
Grok明明是瑟瑟王
43F:噓 komeko: 連手指頭都算錯當然是過譽123.194.236.186 11/30 16:02
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:02:57
44F:推 mithuang: 模型都有權限跑python吧~這是很基本的能 218.164.136.64 11/30 16:03
45F:→ mithuang: 力,gemini不可能沒有 218.164.136.64 11/30 16:03
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:04:12
46F:推 LoveSports: 他說主要是因為不能偷跑程式 146.70.31.61 11/30 16:04
47F:→ LoveSports: 你有自己算過正確答案嗎?他們說人類要 146.70.31.61 11/30 16:05
48F:→ LoveSports: 算好幾天 146.70.31.61 11/30 16:05
我自己有算過啊,因為有約束質數的位置
所以路徑只要思路正確+一點運氣
基本上一天內絕對算得出來
這題是我7年級女兒給我算的題目
她自己大概花了兩天的時間就算出來了
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:08:45
50F:推 LoveSports: 可是如果你自己算過正確答案 為什麼你 45.250.255.14 11/30 16:11
51F:→ LoveSports: 文章一開始說"你先驗算過覺得沒問題" 45.250.255.14 11/30 16:12
52F:→ LoveSports: 直接說你比對你算的答案一樣就好了啊 45.250.255.14 11/30 16:12
53F:推 marke18: XD 42.70.49.92 11/30 16:13
54F:推 LoveSports: 可以把題目貼出來給大家看 大家一起試 45.250.255.14 11/30 16:24
58F:→ LoveSports: 各有長處 也許剛好不適合算這種題目 45.250.255.14 11/30 16:35
59F:→ LoveSports: 拍拍 下個月不要付錢了 45.250.255.14 11/30 16:35
60F:→ paladin499: 問語言模型數學是誰的問題 111.241.150.13 11/30 16:51
61F:推 LoveSports: 我用一分鐘自己筆算算出正確答案 45.250.255.14 11/30 16:57
62F:推 habodaha: 55樓Grok兇屁兇,用什麼關鍵詞調教,才 114.40.209.60 11/30 17:05
63F:→ habodaha: 如此雞巴又流暢?好奇,請分享,謝謝 114.40.209.60 11/30 17:05
64F:推 LoveSports: 你的GPT算的是對的 他真厲害 45.250.255.14 11/30 17:09
65F:推 bcismylove: 笑死A大的好好笑我也想知道是啥提示詞 123.193.174.85 11/30 17:15
67F:→ LoveSports: 我加上你說的扮演數學老師就可以了!! 45.250.255.14 11/30 17:25
68F:推 habodaha: A大的指令如此精簡,成果卻如此生動, 114.40.209.60 11/30 17:30
69F:→ habodaha: 好厲害,真沒有其他設定嗎,指令大神 114.40.209.60 11/30 17:30
70F:推 xm32: 我就說他連題目都會 會錯意 61.230.193.127 11/30 17:33
71F:推 aiggkimd: 嗆他行就行不行就不行,不要繞來繞去 101.12.129.127 11/30 17:41
72F:推 cores: 能反省,還不錯 111.254.144.75 11/30 17:48
73F:推 chichung: 語文辨識gpt還是強 寫程式genmini強 124.6.8.85 11/30 18:37
74F:推 virus2007: 你別用了好嗎?會拉低GEMINI的智商, 49.216.90.250 11/30 19:03
75F:→ virus2007: 害到大家 49.216.90.250 11/30 19:03
76F:→ enunion: 你是不是沒點 思考型 42.77.66.52 11/30 19:50
77F:推 yao03911: 免費版我問一樣的問題,我覺得gemini現 36.230.209.197 12/01 01:30
78F:→ yao03911: 在回答比chatgpt好耶 36.230.209.197 12/01 01:30
79F:推 homerunball: Gemini明明廢爆不知道誰在吹125.230.201.127 12/01 02:41