作者icrose (人本良心)
看板Stock
标题[新闻] 马斯克吹了半年的模型终於发布:Grok 3 你需要知道的所
时间Wed Feb 19 23:17:29 2025
原文标题:马斯克吹了半年的模型终於发布:Grok 3 你需要知道的所有信息
原文连结:
https://news.qq.com/rain/a/20250218A04EFA00
发布时间:2025-02-18 13:29
记者署名:归藏
原文内容:
从 24 年底马斯克就开始给他们新建巨大计算中心训练的 Grok3 模型开始预热了,今天中午 12 点的直播活动中终於发布了 Grok3。
这次马斯克开始玩真的了,不仅模型的素质跟上了 Open AI 的 O1,而且在产品功能上全面对标 ChatGPT。
训练的硬件
Musk 声称 Grok 3 的开发使用了比其前身 Grok 2「10 倍」多的计算资源,xAI 一直在使用位於孟菲斯的一个庞大数据中心——一个包含约 20 万个 GPU 的数据中心——来训练 Grok 3。其中的一期工程只用了 122 天就完成了,工程这块还得看马斯克。
图片
模型能力
Grok 3 的训练量是 Grok 2 的 10 倍,在 1 月初完成了预训练,即使现在依然在训练过程中。
Grok3 包含两个模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在内的基准测试中显着优於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表现不错。目前的早期版本在 Elo 机制的 LLM 竞技场 1400 分排第一。
图片
同时 Grok3 也具备推理能力,马斯克表示在代码能力上 Grok3 非常强,同时在推理时不会展示原始思考过程。
至於推理性能,在提供更多测试时间计算资源(使其能够思考更长时间)的情况下,它优於 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表现也高於 o3-mini-high。
图片
深度搜索功能
除了模型能力对标 Open AI 之外,前沿的 Agents 能力也必须跟上,Grok3 支持类似 Open AI 深度研究的 DeepSearch能力。
这个功能模型能够深入思考用户意图、需要考虑哪些事实、要浏览多少个网站、可以交叉验证不同来源,确保信息的真实性。DeepSearch 还会公开其执行搜索本身所采取的步骤。
图片
如何使用和收费
目前最先可以体验到 Grok3 的渠道应该是推特的 X Premium+ 会员,同时他们也推出了单独的 Grok 网站和 APP。
另外还有搭配单独有用的 Super Grok 会员,支持 Grok 3的权限、解锁DeepSearch和Think功能、抢先体验新功能、更高的图像生成限制等。
图片
未来规划
网页和应用的所有功能会在一周内推全、API 会在几周内推出。
一周後还会有由 Grok 驱动的语音应用即将推出。
另外 Grok2 可能会在几个月後开源,最後一个版本将在最新版本完全发布後开源。
心得/评论:
grok3相当於在给deepseek打配合吧。
花了DS200倍的训练成本,提高了一点点分数。恰恰证明了堆硬件的路彻底走不通了,毫无意义
我觉得今晚NASDAQ跌的就是这个吧。还有什麽原因呢
--
当心,被击沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 171.14.60.249 (中国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1739978254.A.F0B.html
1F:推 gino0717 : 可以色色吗 02/19 23:18
2F:推 SRNOB : 没强多少 1%多 耗能更多 02/19 23:20
3F:→ zzzbear : 也吹太久 02/19 23:21
4F:推 qwe78971 : 贵 没什麽用 目前跟各大佬聊 价格一致看衰 02/19 23:21
5F:→ SRNOB : 大力出奇蹟已经出现边际效益递减 02/19 23:21
6F:→ s1612316 : 只要还不是独大 成本就别想回收 02/19 23:25
7F:→ s1612316 : 收费至少要再少一百倍 02/19 23:26
8F:推 gladopo : 马老板的东西不用回收,再吹一下就一堆融资 02/19 23:27
9F:推 ter2788 : OPENAI做一个我也做一个 明明是差不多的东西但钱还 02/19 23:29
10F:→ ter2788 : 是要花 02/19 23:29
11F:→ ter2788 : 这是力大飞砖 但也是做差不多的东西 02/19 23:29
12F:→ gladopo : 他就看openai不爽啊,要自己搞一个 02/19 23:31
13F:推 SRNOB : 这条路有点到底了 资料也都训练完 只能另辟蹊跷 02/19 23:31
14F:→ SRNOB : 微软最近放一个重磅的 GitHub 冲分好高 02/19 23:32
15F:推 Orianna : 10倍资源? omg 那有几倍功效吗 02/19 23:33
16F:推 ter2788 : 现在最大问题是 这样堆真能AGI? 02/19 23:34
17F:推 simba1222 : 觉得再过不久就会把各家模型拿去军用,再让他们对 02/19 23:35
18F:→ simba1222 : 打,决定谁最强 02/19 23:35
19F:→ Ceferino : 整天只会吹,看起来就像把别人论文写的东西跟架构 02/19 23:36
20F:→ Ceferino : 用他的20万张gpu跟海量资料复现而已 02/19 23:36
21F:推 s90002442 : tsla乖乖回300吧 02/19 23:38
22F:推 gamixxxx : 最後上车时间 All in Tsll 02/19 23:41
23F:推 seemoon2000 : 这就跟读书一样啊 你要全科PR80 没有太困难 但你要 02/19 23:44
24F:推 dongdong0405: TSLA还没买够啊 02/19 23:44
25F:→ seemoon2000 : 全科PR90以上 投入的时间和效益会越来越低阿 02/19 23:45
26F:推 oyaji5566 : 人家都开源了你还在收费 02/19 23:46
27F:→ CYL009 : 马斯克很会做直销的啦 安啦 02/19 23:48
28F:嘘 e123456ddd : 又一个觉得自己比巨头们聪明的 02/19 23:48
29F:→ liangnet : 说不定差那分数就差多了,毕竟使用者最终要的是可 02/19 23:51
30F:→ liangnet : 以回答他正确的答案,而不是瞎掰的答案。 02/19 23:51
31F:推 ejnfu : 但NVDA没跌 02/19 23:55
32F:→ ejnfu : 都回140了 02/19 23:55
33F:推 seemoon2000 : AI不是永远都在跑这个语言模型 主要是还有其他应用 02/19 23:56
34F:→ partsex : tsm股价真弱 02/20 00:05
35F:→ partsex : 该不回真的要等合资的事情确认後 才会涨或跌吧? 02/20 00:05
36F:推 acgotaku : 看 gpt 4.5会不会被提前逼出来 如果没有 02/20 00:10
37F:推 iuiuisme : 99特斯拉 02/20 00:10
38F:→ acgotaku : Grok3 可能就是在走 OpenAI走过的路而已 02/20 00:10
39F:推 sgaor : Nasdaq狂跌0.22% 02/20 00:11
40F:推 dophin332 : 这个鬼东西的价值是没有内建DEI吧 02/20 00:12
41F:推 chysh : 你敢用deepseek便宜自驾还是grok十万片H100堆出来的 02/20 00:13
42F:→ chysh : 自驾? 02/20 00:14
43F:嘘 willy0411 : 喔喔喔喔喔喔喔喔 02/20 00:15
44F:→ fgkor123 : 力大出奇蹟 02/20 00:19
45F:推 Karida : deepseek动不动就系统崩溃当机,谁敢用在自驾上? 02/20 00:22
46F:推 OneDianHwen : Nvda SMCI :你们买不够多! 02/20 00:23
47F:→ sezna : grok没什麽突破才是问题,ds有开源和拉低门槛。 02/20 00:26
48F:→ ejnfu : SMCI都要60了.. 18抄底的爽死 02/20 00:29
49F:推 Brioni : 但目前最高分就他 02/20 00:29
50F:推 jo4 : AI世界以後大概只有第一和others 02/20 00:37
51F:→ jo4 : 大佬又不是客家人谁在和你CP值 02/20 00:39
52F:→ jo4 : 以後就是硬体最新资源最多的赢 一切一切预告在前 02/20 00:40
53F:嘘 highca0709 : 还在吹DS我真的笑死,随便一点访问量就崩溃的烂AI 02/20 00:56
54F:→ highca0709 : 还有人说堆硬体没用 02/20 00:56
55F:推 dtfg : 一堆乡民自以为比首富和专家聪明厉害,笑死 02/20 00:59
56F:推 ImHoluCan : DS严重算力不足,问个问题ㄧ直伺服器繁忙,DS自己 02/20 01:07
57F:→ ImHoluCan : 也说太多人用刮分算力 02/20 01:07
58F:嘘 LimYoHwan : 吹半年? grok从零开始研发也才1年 02/20 01:10
59F:推 TSMCfabXX : 在台湾用自驾很好啊 自撞当自驾 02/20 01:39
60F:推 kingofsdtw : 要收费,我pass 02/20 02:17
61F:推 etset : DS还有天才少女 02/20 02:34
62F:推 zzzzaaaa : 可以吹花最多的钱啊,nv感谢您 02/20 02:49
63F:→ qoojo2002 : 快压机器人股啊 02/20 03:17
64F:推 stosto : grok後来不是变20万片100+200? 02/20 03:56
65F:→ stosto : 现在看起来就是堆算力,狂堆,狂堆,再狂堆 02/20 03:56
66F:→ stosto : 这就是AI 02/20 03:57
67F:推 ksjr : 我知道老马还有钱 02/20 04:35
68F:→ dream12305 : 20号腿了 02/20 07:55
69F:推 lrac : 他们比较晚才投入吧 短时间迎头赶上了 02/20 07:57
70F:→ lavign : 恶男AI 02/20 08:09
71F:→ bojan0701 : AI 後期就是加堆巨大算力,获得小小改善... 02/20 08:14
72F:推 mopa : 就说了,推论落地的算力需求远大约训练。 02/20 08:25
73F:→ jceefailurer: 这个可以用来分析股票吗? 02/20 08:31
74F:推 kotorichan : 推论用华为芯片就够了 过一阵子再看看DS有没有改善 02/20 08:35
75F:→ forbefor : DS就是蒸馏仔 跩啥小 02/20 08:55
76F:推 g1254501 : 力大出棒槌 02/20 10:01
77F:推 jimmy12332 : 现在买一张4090就能跑deepseek 671B的完整model 谁 02/20 10:54
78F:→ jimmy12332 : 需要你们这些算力怪物? 02/20 10:54
79F:推 eric356 : 战斗机你比别人多个0.1秒就可以打趴对方 02/20 11:00
80F:→ lluunnaa : 昨天X都是马投顾跟我川XD 02/20 11:16
81F:推 ejnfu : 讲半天 NVDA也是涨回140了 02/20 11:38
82F:推 eoeoeo : 我们也有天才美少女 02/20 12:34
83F:推 annboy : 拜托 老马是要跟OpenAI 拼SOTA跟AGI 02/20 13:43
84F:→ annboy : 蒸馏是另一个赛事 不要混为一谈 02/20 13:43
87F:→ ilqgray : 这几篇综合讲了deepseek 苹果和老马xAI的动态 02/20 16:00
88F:→ ilqgray : 还提到南韩的新计划...有些替台湾担心啊 02/20 16:01
89F:推 Klauhal : Grok3问冷门的东西也能答出来挺屌的,比DS好多了 02/20 16:17
92F:推 davidr : ds要蒸馏也要有一级的训练数据啊 02/20 20:05