[西洋] AI棋赛！马斯克Grok决赛出包　OpenAI o3

时间Wed Aug 13 01:15:40 2025

AI棋赛！马斯克Grok决赛出包　OpenAI o3直落四完封称霸 ETtoday新闻云> AI科技 https://tinyurl.com/24p5dklf https://tinyurl.com/2bqdzxv4 ▲西洋棋。（示意图／pixabay）图文／CTWANT OpenAI与马斯克（Elon Musk）旗下xAI的人工智慧模型Grok，首次在西洋棋赛场上正面交锋，最终由OpenAI的o3大型语言模型以4比0击败Grok 4，夺下由Google平台Kaggle举办的 AI Exhibition Tournament冠军。这场为期三天的比赛於5日至7日举行，参赛阵容包括 Anthropic、Google、DeepSeek、Moonshot AI等多家开发商的模型。根据《独立报》报导，Grok 4在决赛中多次出现重大失误，包括关键时刻连续失去皇后，最终被o3以四连胜的方式击败。 Chess.com撰稿人平哈塔（Pedro Pinhata）形容，Grok在准决赛前一直被视为夺冠热门，但最後一天完全失去节奏；反观o3的平均准确率高达91%，在多数情况下毫不留情地抓住对手失误。报导中也提到，这场冠军对决其实带有浓厚的个人色彩。OpenAI执行长阿特曼（Sam Altman）与马斯克十年前共同创办OpenAI，後者之後离开并成立xAI。後续阿特曼曾指控马斯克试图收购ChatGPT开发公司未果，并称他是「恶霸」。马斯克则在X平台发文淡化比赛结果，声称xAI几乎未在西洋棋领域投入资源，并表示Grok 4的棋力仅是「副产品」。 Google的Gemini模型在季军战中以3.5比0.5击败o4-mini，夺下第三名。DeepSeek与 Moonshot AI则在八强赛止步。本次比赛旨在检验大型语言模型於复杂策略游戏中的推理与决策能力，像西洋棋、围棋等规则严谨的游戏，被视为测试AI学习与完成目标的重要工具。马斯克在赛前已对外发表评论，而西洋棋界人士同样关注这场AI对决。现任世界排名第一的棋手马卡尔森（Magnus Carlsen）曾於7月的线上赛击败ChatGPT，且未损一子。他在赛後评估，Grok的棋力等级分约800，o3约在1200左右，远低於他巅峰时的2882分。当有X平台用户询问时，Grok自评的等级分则在1600至1800之间。自1997年IBM的深蓝（Deep Blue）在六局比赛中击败世界冠军卡斯帕洛夫（Garry Kasparov）以来，电脑战胜人类顶尖棋手已非新鲜事。後续Google DeepMind等团队更研发出能以超人水准自我训练的棋类AI。这次Kaggle举办的比赛，是自2022年ChatGPT问世以来，首次专为通用型大型语言模型举行的大型西洋棋赛事。Take Take Take公司执行长克里斯蒂安森（Mats André Kristiansen）形容，此类比赛的价值在於深入观察AI的推理与思考模式。 ---------------------------------------------------------- AI象棋大赛开战！OpenAI o3夺冠 Grok 4遭辗压败北钜亨网新闻中心 2025年8月11日周一上午11:50 [GMT+8] https://tinyurl.com/286b47q9 Kaggle 平台上举办的一场史无前例的 AI 象棋锦标赛中，八个顶级 AI 模型展开了激烈的厮杀。参赛者包括 OpenAI 的 o3、马斯克 xAI 的 Grok 4、Google的 Gemini，以及中国 AI DeepSeek 等。这场竞赛不仅考验了 AI 的棋艺，更被视为各家科技公司展示其通用模型在复杂逻辑与策略推理方面实力的一场「秀肌肉」之战。比赛初期，马斯克旗下的 Grok 4 模型表现势不可挡，以压倒性优势一路横扫进决赛。专家预言「没有什麽能拦住它」。外界普遍看好 Grok 4 能轻松夺冠，马斯克也似乎准备好在社群媒体上庆祝胜利。然而，决赛的戏剧性转变令人大跌眼镜。面对 OpenAI 的 o3 模型，Grok 4 的表现突然判若两「人」，竟在棋局中频频出现低级失误，甚至连续失子，包括至关重要的皇后。这出人意料的表现让观看直播的西洋棋大师也瞠目结舌。知名棋手 Hikaru Nakamura 在直播中惊呼：「Grok 犯了太多错误，OpenAI 一个都没犯！」最终，OpenAI 的 o3 模型以零封 Grok 4 的战绩赢得了冠军。面对惨败，马斯克在社群媒体上发文表示：「我们压根没在象棋上花心思，这只是副产品。」这番话语被许多人解读为为败北找藉口，但也带有些许幽默的意味。这场比赛再次引发了人们对 AI 发展的思考。虽然这些通用 AI 模型并非专为象棋设计，但它们在棋盘上展现出的运算、策略规划和学习适应能力，直接反映了当前 AI 技术的进化水平。如同 1997 年 IBM 深蓝战胜西洋棋大师卡斯帕罗夫一样，这场 AI 大战成为了衡量各家 AI 模型智慧与思考能力的试金石，预示着未来 AI 在更多领域的潜力。这场跨界天才的对决也让大众看到，平常协助人们撰写文案、制作 PPT 的 AI，也能在瞬息万变的棋局中展现强大的逻辑推理能力。AI 的未来发展充满无限可能，这场象棋大战或许只是个开端，未来 AI 在各行各业中带来的惊喜将会越来越多。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.14.128 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/chess/M.1755018946.A.91B.html

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

chess 板

[西洋] AI棋赛！马斯克Grok决赛出包　OpenAI o3

热门看板

赞助商连结