作者skyhawkptt (skyhawk)
看板chess
标题[西洋] AI棋赛!马斯克Grok决赛出包 OpenAI o3
时间Wed Aug 13 01:15:40 2025
AI棋赛!马斯克Grok决赛出包 OpenAI o3直落四完封称霸
ETtoday新闻云> AI科技
https://tinyurl.com/24p5dklf
https://tinyurl.com/2bqdzxv4
▲西洋棋。(示意图/pixabay)
图文/CTWANT
OpenAI与马斯克(Elon Musk)旗下xAI的人工智慧模型Grok,首次在西洋棋赛场上正面交
锋,最终由OpenAI的o3大型语言模型以4比0击败Grok 4,夺下由Google平台Kaggle举办的
AI Exhibition Tournament冠军。这场为期三天的比赛於5日至7日举行,参赛阵容包括
Anthropic、Google、DeepSeek、Moonshot AI等多家开发商的模型。
根据《独立报》报导,Grok 4在决赛中多次出现重大失误,包括关键时刻连续失去皇后,
最终被o3以四连胜的方式击败。
Chess.com撰稿人平哈塔(Pedro Pinhata)形容,Grok在准决赛前一直被视为夺冠热门,
但最後一天完全失去节奏;反观o3的平均准确率高达91%,在多数情况下毫不留情地抓住
对手失误。
报导中也提到,这场冠军对决其实带有浓厚的个人色彩。OpenAI执行长阿特曼(Sam
Altman)与马斯克十年前共同创办OpenAI,後者之後离开并成立xAI。
後续阿特曼曾指控马斯克试图收购ChatGPT开发公司未果,并称他是「恶霸」。马斯克则
在X平台发文淡化比赛结果,声称xAI几乎未在西洋棋领域投入资源,并表示Grok 4的棋力
仅是「副产品」。
Google的Gemini模型在季军战中以3.5比0.5击败o4-mini,夺下第三名。DeepSeek与
Moonshot AI则在八强赛止步。本次比赛旨在检验大型语言模型於复杂策略游戏中的推理
与决策能力,像西洋棋、围棋等规则严谨的游戏,被视为测试AI学习与完成目标的重要工
具。
马斯克在赛前已对外发表评论,而西洋棋界人士同样关注这场AI对决。现任世界排名第一
的棋手马卡尔森(Magnus Carlsen)曾於7月的线上赛击败ChatGPT,且未损一子。他在赛
後评估,Grok的棋力等级分约800,o3约在1200左右,远低於他巅峰时的2882分。当有X平
台用户询问时,Grok自评的等级分则在1600至1800之间。
自1997年IBM的深蓝(Deep Blue)在六局比赛中击败世界冠军卡斯帕洛夫(Garry
Kasparov)以来,电脑战胜人类顶尖棋手已非新鲜事。後续Google DeepMind等团队更研
发出能以超人水准自我训练的棋类AI。
这次Kaggle举办的比赛,是自2022年ChatGPT问世以来,首次专为通用型大型语言模型举
行的大型西洋棋赛事。Take Take Take公司执行长克里斯蒂安森(Mats André
Kristiansen)形容,此类比赛的价值在於深入观察AI的推理与思考模式。
----------------------------------------------------------
AI象棋大赛开战!OpenAI o3夺冠 Grok 4遭辗压败北
钜亨网新闻中心
2025年8月11日周一 上午11:50 [GMT+8]
https://tinyurl.com/286b47q9
Kaggle 平台上举办的一场史无前例的 AI 象棋锦标赛中,八个顶级 AI 模型展开了激烈
的厮杀。参赛者包括 OpenAI 的 o3、马斯克 xAI 的 Grok 4、Google的 Gemini,以及中
国 AI DeepSeek 等。这场竞赛不仅考验了 AI 的棋艺,更被视为各家科技公司展示其通
用模型在复杂逻辑与策略推理方面实力的一场「秀肌肉」之战。
比赛初期,马斯克旗下的 Grok 4 模型表现势不可挡,以压倒性优势一路横扫进决赛。专
家预言「没有什麽能拦住它」。外界普遍看好 Grok 4 能轻松夺冠,马斯克也似乎准备好
在社群媒体上庆祝胜利。
然而,决赛的戏剧性转变令人大跌眼镜。面对 OpenAI 的 o3 模型,Grok 4 的表现突然
判若两「人」,竟在棋局中频频出现低级失误,甚至连续失子,包括至关重要的皇后。这
出人意料的表现让观看直播的西洋棋大师也瞠目结舌。知名棋手 Hikaru Nakamura 在直
播中惊呼:「Grok 犯了太多错误,OpenAI 一个都没犯!」
最终,OpenAI 的 o3 模型以零封 Grok 4 的战绩赢得了冠军。面对惨败,马斯克在社群
媒体上发文表示:「我们压根没在象棋上花心思,这只是副产品。」这番话语被许多人解
读为为败北找藉口,但也带有些许幽默的意味。
这场比赛再次引发了人们对 AI 发展的思考。虽然这些通用 AI 模型并非专为象棋设计,
但它们在棋盘上展现出的运算、策略规划和学习适应能力,直接反映了当前 AI 技术的进
化水平。
如同 1997 年 IBM 深蓝战胜西洋棋大师卡斯帕罗夫一样,这场 AI 大战成为了衡量各家
AI 模型智慧与思考能力的试金石,预示着未来 AI 在更多领域的潜力。
这场跨界天才的对决也让大众看到,平常协助人们撰写文案、制作 PPT 的 AI,也能在瞬
息万变的棋局中展现强大的逻辑推理能力。AI 的未来发展充满无限可能,这场象棋大战
或许只是个开端,未来 AI 在各行各业中带来的惊喜将会越来越多。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.14.128 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/chess/M.1755018946.A.91B.html