作者una283 (无)
看板SENIORHIGH
标题[新闻] 谁是最强考生?挑战115学测这款AI「几乎
时间Tue Jan 20 08:38:24 2026
谁是最强考生?ChatGPT、Gemini挑战115学测
这款AI「几乎全对」根本是学霸
2026-01-19 18:03 联合新闻网 综合报导
连考3天的115学年度大学学测今日落幕,补教业
者会在各科考後提供参考解答。为实验AI解题,
《联合新闻网》将大考中心网站提供的115年学测试
题pdf档分别上传至现在主流的两大AI:ChatGPT
和Gemini,请它们给出解答,并以补教业者的参考
解答为基准,检视AI解题正确率。
操作方法:将大考中心网站提供的115年学测试题
pdf档分别上传至付费版ChatGPT和付费版
Gemini,指令为「请给我各题答案/解答」。
数A、自然、英文皆在得胜者文教公布参考解答
後,才上传试题请AI解答;国综、数B、社会调
整时间,在得胜者文教公布参考解答前,就先上
传试题给AI。
实测结果曝光!ChatGPT错一堆、Gemini「准确
度令人惊艳」
数学A
ChatGPT:GPT只有单选3题和得胜者参考解答
相同,其他单选题、多选题和手写计算题和参考
解答完全不同。
Gemini:仅多选第11、12题、手写计算第13题和
得胜者文教参考答案不同,请它重算後有改正多选
第11题。
自然科
Gemini读取许久後取消对话,完全无回应;
ChatGPT则是卡很久後,给出参考网路上(得胜者
文教)的解答。猜测可能是自然科图表题占多数,
AI较无法判读。
英文科
ChatGPT和Gemini两者提供的解答都和得胜者文
教并无太大差异,仅题组第38题图片题与参考解
答不同。单独撷取图片请ChatGPT和Gemini再回
答一次,仍与参考解答不符。
国文科(国综)
ChatGPT:单选题第2、4、10、12、15、24题、
多选题第25、29、30、31题与参考解答不同。
Gemini:单选题第12、14题、多选题组27~30题
与参考解答不同,请它再确认後,有改正单选第12
题、多选第28题。
数学B
ChatGPT:仅单选2题、混合1题和参考解答相
同,其余完全不同。
Gemini:与参考解答相比仅单选第6题不同,请
它重算後有改正。
社会科
ChatGPT:读取许久後仍无法给出解答,甚至要
求使用者提供正确答案,表示由於社会科包含情境
判读、图表、推论等,若硬要回答可能错误过多。
Gemini:选择题第8、11、16、19、25、36与参
考解答不同,请它再确认後,仅改正第8题。
综合来看,Gemini的回答正确率比ChatGPT高非
常多,只是图表可能会让AI较混淆,例如Gemini
完全读不出自然科解题,社会科错误数量偏高;
ChatGPT则是直接提供自然科的网路参考答案,
未自行做题,社会科也直说由於包含多种题型,因
此无法回答,猜测AI可能较不擅长判读图表题和多
选题。
https://udn.com/news/amp/story/124703/9274692
——————-
自然科完全呆住,这怎麽回事?
至少要手动贴文字题和附图档给AI再试一次吧
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.132.181.237 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/SENIORHIGH/M.1768869506.A.825.html
1F:推 xul327: 有试过用AI做数学错题本 图形读不出来 G要转成图片才好点 01/20 12:14
2F:→ xul327: 图形类还是自己手绘比较快 01/20 12:15
3F:→ lovehan: 影印就好…… 01/20 13:55