作者una283 (無)
看板SENIORHIGH
標題[新聞] 誰是最強考生?挑戰115學測這款AI「幾乎
時間Tue Jan 20 08:38:24 2026
誰是最強考生?ChatGPT、Gemini挑戰115學測
這款AI「幾乎全對」根本是學霸
2026-01-19 18:03 聯合新聞網 綜合報導
連考3天的115學年度大學學測今日落幕,補教業
者會在各科考後提供參考解答。為實驗AI解題,
《聯合新聞網》將大考中心網站提供的115年學測試
題pdf檔分別上傳至現在主流的兩大AI:ChatGPT
和Gemini,請它們給出解答,並以補教業者的參考
解答為基準,檢視AI解題正確率。
操作方法:將大考中心網站提供的115年學測試題
pdf檔分別上傳至付費版ChatGPT和付費版
Gemini,指令為「請給我各題答案/解答」。
數A、自然、英文皆在得勝者文教公布參考解答
後,才上傳試題請AI解答;國綜、數B、社會調
整時間,在得勝者文教公布參考解答前,就先上
傳試題給AI。
實測結果曝光!ChatGPT錯一堆、Gemini「準確
度令人驚艷」
數學A
ChatGPT:GPT只有單選3題和得勝者參考解答
相同,其他單選題、多選題和手寫計算題和參考
解答完全不同。
Gemini:僅多選第11、12題、手寫計算第13題和
得勝者文教參考答案不同,請它重算後有改正多選
第11題。
自然科
Gemini讀取許久後取消對話,完全無回應;
ChatGPT則是卡很久後,給出參考網路上(得勝者
文教)的解答。猜測可能是自然科圖表題占多數,
AI較無法判讀。
英文科
ChatGPT和Gemini兩者提供的解答都和得勝者文
教並無太大差異,僅題組第38題圖片題與參考解
答不同。單獨擷取圖片請ChatGPT和Gemini再回
答一次,仍與參考解答不符。
國文科(國綜)
ChatGPT:單選題第2、4、10、12、15、24題、
多選題第25、29、30、31題與參考解答不同。
Gemini:單選題第12、14題、多選題組27~30題
與參考解答不同,請它再確認後,有改正單選第12
題、多選第28題。
數學B
ChatGPT:僅單選2題、混合1題和參考解答相
同,其餘完全不同。
Gemini:與參考解答相比僅單選第6題不同,請
它重算後有改正。
社會科
ChatGPT:讀取許久後仍無法給出解答,甚至要
求使用者提供正確答案,表示由於社會科包含情境
判讀、圖表、推論等,若硬要回答可能錯誤過多。
Gemini:選擇題第8、11、16、19、25、36與參
考解答不同,請它再確認後,僅改正第8題。
綜合來看,Gemini的回答正確率比ChatGPT高非
常多,只是圖表可能會讓AI較混淆,例如Gemini
完全讀不出自然科解題,社會科錯誤數量偏高;
ChatGPT則是直接提供自然科的網路參考答案,
未自行做題,社會科也直說由於包含多種題型,因
此無法回答,猜測AI可能較不擅長判讀圖表題和多
選題。
https://udn.com/news/amp/story/124703/9274692
——————-
自然科完全呆住,這怎麼回事?
至少要手動貼文字題和附圖檔給AI再試一次吧
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.132.181.237 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/SENIORHIGH/M.1768869506.A.825.html
1F:推 xul327: 有試過用AI做數學錯題本 圖形讀不出來 G要轉成圖片才好點 01/20 12:14
2F:→ xul327: 圖形類還是自己手繪比較快 01/20 12:15
3F:→ lovehan: 影印就好…… 01/20 13:55