作者AmosYang (twy30)
看板Soft_Job
标题[讨论] AGI 评监/预测
时间Fri Jul 4 11:56:47 2025
对 AGI (Artificial General Intelligence) 的进展有兴趣的话可以看看
https://arcprize.org/ 这个 AGI 评监系统,尤其是试玩一下它的 2025 年版的
ARG-AGI-2 题目 (
https://arcprize.org/play ),
* 看看你觉得这样的题目对人脑来说的难易度
* 看看你觉得「符号解读、组合推理、上下文规则应用」是否为 AGI 的必要条件
* 看看你觉得这些题组是否能有效测量「符号解读、组合推理、上下文规则应用」
然後参考以下数据 (
https://arcprize.org/leaderboard ):
* 人脑最高分是 100%, 每个工作项目成本 $17
* 最高分的 AI (Claude Opus 4) 得分 8.6%, 每个工作项目成本 $1.93
* 次高分的 AI (ChatGPT o3) 得分 6.5%, 每个工作项目成本 $0.834
* 「纯 LLM」 AI 最高分数 1.3%
2019~2024 年使用的 ARC-AGI-1 题目, AI 最高得分是约 75% 。
另一个可以参考的网站是
https://theagiclock.com/ ,预测 AGI 到来的时间
(以及解释它预测的根据); 可以 3~6 个月後来看看 AGI 的进展是线性、指数
,还是卡关。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 136.47.253.135 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1751601414.A.648.html
https://theagiclock.com/ 的预测是 2028-06-30 。
※ 编辑: AmosYang (136.47.253.135 美国), 07/04/2025 12:00:02
※ 编辑: AmosYang (136.47.253.135 美国), 07/04/2025 12:07:37
※ 编辑: AmosYang (136.47.253.135 美国), 07/04/2025 12:10:57
1F:推 jamesho8743: 有意思的网站 谢分享 07/04 12:24
2F:推 attacksoil: 有趣 07/04 12:36
===
https://theagiclock.com/experts
有更进一步列出各专家的预测及观点;从 Elon Musk 的 2025~2026 到
Andrew Ng 的 2040~2060 都很有意思。
※ 编辑: AmosYang (136.47.253.135 美国), 07/04/2025 12:42:54
3F:推 haudoing: 还蛮好玩的我还没输XD 07/07 16:43
4F:推 KAOKAOKAO: 本以为是抬杠文 内容是有料资讯 建议标题扩充 07/09 08:54
* 原标题: [讨论] AGI
* 新标题: [讨论] AGI 评监/预测
有其它扩充方向可以提出来讨论。
※ 编辑: AmosYang (136.47.253.135 美国), 07/11/2025 04:45:21
※ 编辑: AmosYang (136.47.253.135 美国), 07/11/2025 04:47:47
Grok 4 拿下最高分 16%, 每工作项目成本 $2.17
※ 编辑: AmosYang (136.47.253.135 美国), 07/11/2025 04:49:26
5F:推 CoNsTaR: 最近有一篇论文用一个 27M (对,27M 不是 27b) paramete 08/02 14:34
6F:→ CoNsTaR: rs 的 recurrent network 没有 pre-training,训练只用了 08/02 14:34
7F:→ CoNsTaR: 1000 steps 就达到 40% 08/02 14:34