作者error405 (流河=L)
看板AI_Art
标题Re: [情报] grok4释出直播 7/10中午
时间Thu Jul 10 13:58:37 2025
由於 Grok 4 的发布直播已於 2025 年 7 月 9 日晚 8 点(太平洋时间,台湾时间 7
月 10 日中午 12 点)结束,以下是基於现有资讯和 X 平台上用户反馈整理的直播摘要
,重点概述 Grok 4 的亮点和发布内容:
### **Grok 4 发布直播摘要**
1. **性能突破与基准测试**:
- Grok 4 被 xAI 宣称为「全球最强大的 AI 模型」,在多项基准测试中超越现有模
型(如 OpenAI 的 GPT-4o、Google 的 Gemini 2.5 Pro)。特别是在「人类最後一次考
试」(HLE, Humanity Last Exam)基准中,Grok 4 未使用工具时得分 26.9%,使用工具
後达 41%,通过「test-time scaling」(多智能体协作)进一步提升至 50%,创下新的
SOTA(State-of-the-Art,当前最佳表现)。这显示其在复杂推理和问题解决上的卓越能
力。
2. **计算能力提升**:
- Grok 4 的训练使用了比 Grok 3 多 10 倍的计算资源,依托 xAI 在孟菲斯建造的
Colossus 超级计算机(包含约 200,000 个 Nvidia GPU)。这使模型在处理速度、推理
能力和数据处理规模上大幅提升,特别适用於高计算需求的任务。
[](
https://en.wikipedia.org/wiki/Grok_%28chatbot%29)
3. **双模型发布**:
- **Grok 4(通用模型)**:针对日常用户,支援写作、研究、翻译等任务,具备进
阶逻辑推理、结构化输出和函数调用功能,特别在数学、科学和自然语言理解上有显着提
升。
[](
https://www.livemint.com/gadgets-and-appliances/grok-4-launch-check-expected-features-and-how-to-watch-the-launch-11752040899452.html)[](https://www.indiaherald.com/Technology/Read/994832705/Elon-Musk-Confirms-Grok-Release-On-July-)
- **Grok 4 Code**:专为开发者设计的编程模型,类似 Cursor,提供程式码生成、
错误检测和上下文相关的软体开发支援,支援 CLI 整合,可嵌入用户自定义的程式码编
辑器。
[](
https://www.livemint.com/gadgets-and-appliances/grok-4-launch-check-expected-features-and-how-to-watch-the-launch-11752040899452.html)[](https://news.futunn.com/en/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)
4. **进阶推理与第一原理**:
- Grok 4 强调「第一原理推理」(first-principles reasoning),能针对火箭引擎
、电动车马达等技术问题提供深入且独立的分析,而非仅依赖网络资料。这使其在回答专
业问题时更具权威性和准确性。
[](
https://www.eonmsk.com/2025/07/08/xai-grok-4-features-and-release-date/)[](https://www.freepressjournal.in/tech/elon-musk-confirms-grok-4-launch-on-july-9-what-to-expect-from-xais-new-flagship-model)
5. **多模态功能预告**:
- 虽然 Grok 4 当前主要支援文本任务,但 xAI 表示未来将引入视觉处理和图像生成
功能,甚至可能支援视频生成,与 Google 的 Veo 3 等竞争。直播中可能展示了初步的
多模态能力,但具体细节尚未完全公开。
[](
https://www.latestly.com/socially/technology/grok-4-release-date-elon-musks-xai-to-launch-upcoming-ai-model-on-july-9-2025-with-advanced-reasoning-image-and-video-generation-capabilities-check-india-launch-time-6983203.html)
6. **语音演示反响**:
- 直播中展示了一个名为「Eve」的语音功能,尝试演唱摇篮曲,但部分用户(如
@tomandshiro)反馈语音表现「 creepy 而不舒缓」,认为 xAI 的语音团队需进一步改
进。
7. **与其他模型的对比**:
- 直播中进行了与 ChatGPT 的实时语音对话演示,Grok 4 的表现据称超越 OpenAI
的模型,特别是在推理速度和回答准确性上。X 用户 @IEObserve 提到这场对比让马斯克
「龙心大悦」。
8. **应用场景与整合**:
- Grok 4 可能与特斯拉的 FSD(全自动驾驶)和 Optimus 人形机器人深度整合,提
供实时推理和决策支援。例如,Optimus 可能利用 Grok 4 的视觉场景推理能力,提升自
主行为表现。
[](
https://news.futunn.com/en/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)[](https://news.futunn.com/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)
- 此外,Grok 4 的 API 将为开发者提供更多可能性,可能支援应用程式开发和智慧
代理工作流。
[](
https://content.techgig.com/technology/grok-4-launch-july10-livestream-xai-elon-musk/articleshow/122314148.cms)
9. **争议与改进**:
- 直播可能回应了此前 Grok 3 在政治偏见和错误资讯上的争议。马斯克曾批评
Grok 3「模仿传统媒体」,xAI 承诺 Grok 4 将通过强化第一原理推理和公开系统提示(
system prompts)来提升透明度和可靠性。
[](
https://www.teslarati.com/elon-musk-confirms-grok-4-launch-july-9-livestream-event/)[](https://en.wikipedia.org/wiki/Grok_%28chatbot%29)
10. **直播观感与市场影响**:
- X 用户 @AI_Whisper_X 提到马斯克在直播中看起来「憔悴」,反映其对 Grok 4
开发的高强度投入。
- 用户普遍对 Grok 4 的性能表示期待,认为其成本效益(「任务对成本比」)可能
领先业界,甚至比拟「每个人都能拥有一个研究所」的智慧水平。
### **如何观看回放**
- 直播於 xAI 官方 X 帐号(@xAI)进行,录像可能已上传至 X 平台或 xAI 官网(x.ai
)。建议访问
https://x.ai 或 xAI 的 X 帐号查看回放连结。
[](
https://x.com/xai/status/1943158495588815072)[](https://www.nextbigfuture.com/2025/07/xai-grok-4-releases-wednesday-july-9-at-8pm-pst.html)
### **总结**
Grok 4 的发布标志着 xAI 在 AI 竞赛中的重大进展,其在推理、编程和潜在多模态功能
的突破使其成为 OpenAI 和 Google 的强力竞争者。直播展示了 Grok 4 的顶尖性能和应
用潜力,但语音功能和细节实现仍需进一步优化。对於开发者和技术爱好者,Grok 4 的
专业化编程模型和 API 支援尤其值得关注。
--
(以上由grok3生成)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.136.192.198 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1752127127.A.49C.html
2F:→ shin2190: 角色扮演/文字创作一坨X,甚至比Grok 3还不如… 07/10 21:26
3F:→ Supasizeit: Grok po推特文称赞希特勒 他完蛋了 07/10 22:57
4F:→ hitlerx: 称赞希特勒为什麽会完蛋 他色色能力若不长进才是会完蛋 07/11 20:57