[闲聊] 玩小游戏证明你比AI聪明 ARC-AGI-3

时间Mon Apr 6 18:01:54 2026

https://arcprize.org/arc-agi/3 按Play [Humans]开始玩说明: ARC-AGI-3 是 2026 年 3 月底才正式推出的互动式（agentic）基准测试，跟之前的 ARC-AGI-1/2 很不一样。它不是静态的格子拼图，而是让 AI 在完全陌生的环境中探索、即时学习目标、建立世界模型、并有效率地行动。人类在这些环境中几乎都能 100% 解决（通常几分钟内搞定）。前沿大模型的表现非常惨：Google Gemini 3.1 Pro Preview：最高约 0.37% OpenAI GPT-5.4 High：约 0.26% Anthropic Claude Opus 4.6 Max：约 0.25% xAI Grok 4.20（Reasoning 模式）：0% 整体来说，目前所有公开测试的前沿 AI 分数都低於 1%，远远达不到「破关」的程度。公开的 agent 尝试（非官方大模型 leaderboard）在 ARC Prize 官方的 unverified live leaderboard（开放给大家提交 agent 的排行），目前最好的开源/自制 agent 分数也只有 12.58%（StochasticGoose 团队，完成 18 个 levels），其他大多在 3~8% 左右。这些是专门为 ARC-AGI-3 设计的 agent，不是纯靠大模型。 ARC Prize 2026 竞赛现况总奖金高达 200 万美元，其中 ARC-AGI-3 轨道的 Grand Prize（100%）是 70 万美元。比赛刚开始没多久（2026/3/25 启动），还有好几个月才到 milestone 和最终截止，目前还在早期阶段，没有人接近 100%。之前 2025 年的 ARC Prize（主要用 ARC-AGI-2）最高也只到 24% 左右，Grand Prize 同样没人领走。简单说，ARC-AGI-3 现在是目前最「未饱和」的 AGI 相关基准之一，专门用来测量 AI 在全新情境下的流体智能（fluid intelligence）和学习效率，目前 AI 跟人类的差距还非常明显。 -- grok整理另外的参考说明:https://www.ithome.com.tw/news/174698 我也过了几个小游戏确定了自己还能被称为人类 AI是不懂自主判断游戏目的游戏机制的至少现在还是啦 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.230.45 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/C_Chat/M.1775469719.A.B1D.html ※ 编辑: error405 (114.36.230.45 台湾), 04/06/2026 18:19:13

1^F：推 uohZemllac: 还挺容易的不知道语言模型是卡在什麽地方 04/06 18:24

2^F：推 Vivian1913: 应该是语言模型没有真正的形式和非形式逻辑能力吧 04/06 18:30

※ error405:转录至看板 AI_Art 04/06 18:34 ※ error405:转录至看板 Little-Games 04/06 18:35

3^F：推 qd6590: YA 我比AI还聪明 04/06 19:06

本网站已依台湾网站内容分级规定处理。此区域为限制级，未满十八岁者不得浏览。

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

C_Chat 板

[闲聊] 玩小游戏证明你比AI聪明 ARC-AGI-3

热门看板

赞助商连结