作者error405 (流河=L)
看板AI_Art
標題Re: [情報] grok4釋出直播 7/10中午
時間Thu Jul 10 13:58:37 2025
由於 Grok 4 的發布直播已於 2025 年 7 月 9 日晚 8 點(太平洋時間,台灣時間 7
月 10 日中午 12 點)結束,以下是基於現有資訊和 X 平台上用戶反饋整理的直播摘要
,重點概述 Grok 4 的亮點和發布內容:
### **Grok 4 發布直播摘要**
1. **性能突破與基準測試**:
- Grok 4 被 xAI 宣稱為「全球最強大的 AI 模型」,在多項基準測試中超越現有模
型(如 OpenAI 的 GPT-4o、Google 的 Gemini 2.5 Pro)。特別是在「人類最後一次考
試」(HLE, Humanity Last Exam)基準中,Grok 4 未使用工具時得分 26.9%,使用工具
後達 41%,通過「test-time scaling」(多智能體協作)進一步提升至 50%,創下新的
SOTA(State-of-the-Art,當前最佳表現)。這顯示其在複雜推理和問題解決上的卓越能
力。
2. **計算能力提升**:
- Grok 4 的訓練使用了比 Grok 3 多 10 倍的計算資源,依托 xAI 在孟菲斯建造的
Colossus 超級計算機(包含約 200,000 個 Nvidia GPU)。這使模型在處理速度、推理
能力和數據處理規模上大幅提升,特別適用於高計算需求的任務。
[](
https://en.wikipedia.org/wiki/Grok_%28chatbot%29)
3. **雙模型發布**:
- **Grok 4(通用模型)**:針對日常用戶,支援寫作、研究、翻譯等任務,具備進
階邏輯推理、結構化輸出和函數調用功能,特別在數學、科學和自然語言理解上有顯著提
升。
[](
https://www.livemint.com/gadgets-and-appliances/grok-4-launch-check-expected-features-and-how-to-watch-the-launch-11752040899452.html)[](https://www.indiaherald.com/Technology/Read/994832705/Elon-Musk-Confirms-Grok-Release-On-July-)
- **Grok 4 Code**:專為開發者設計的編程模型,類似 Cursor,提供程式碼生成、
錯誤檢測和上下文相關的軟體開發支援,支援 CLI 整合,可嵌入用戶自定義的程式碼編
輯器。
[](
https://www.livemint.com/gadgets-and-appliances/grok-4-launch-check-expected-features-and-how-to-watch-the-launch-11752040899452.html)[](https://news.futunn.com/en/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)
4. **進階推理與第一原理**:
- Grok 4 強調「第一原理推理」(first-principles reasoning),能針對火箭引擎
、電動車馬達等技術問題提供深入且獨立的分析,而非僅依賴網絡資料。這使其在回答專
業問題時更具權威性和準確性。
[](
https://www.eonmsk.com/2025/07/08/xai-grok-4-features-and-release-date/)[](https://www.freepressjournal.in/tech/elon-musk-confirms-grok-4-launch-on-july-9-what-to-expect-from-xais-new-flagship-model)
5. **多模態功能預告**:
- 雖然 Grok 4 當前主要支援文本任務,但 xAI 表示未來將引入視覺處理和圖像生成
功能,甚至可能支援視頻生成,與 Google 的 Veo 3 等競爭。直播中可能展示了初步的
多模態能力,但具體細節尚未完全公開。
[](
https://www.latestly.com/socially/technology/grok-4-release-date-elon-musks-xai-to-launch-upcoming-ai-model-on-july-9-2025-with-advanced-reasoning-image-and-video-generation-capabilities-check-india-launch-time-6983203.html)
6. **語音演示反響**:
- 直播中展示了一個名為「Eve」的語音功能,嘗試演唱搖籃曲,但部分用戶(如
@tomandshiro)反饋語音表現「 creepy 而不舒緩」,認為 xAI 的語音團隊需進一步改
進。
7. **與其他模型的對比**:
- 直播中進行了與 ChatGPT 的實時語音對話演示,Grok 4 的表現據稱超越 OpenAI
的模型,特別是在推理速度和回答準確性上。X 用戶 @IEObserve 提到這場對比讓馬斯克
「龍心大悅」。
8. **應用場景與整合**:
- Grok 4 可能與特斯拉的 FSD(全自動駕駛)和 Optimus 人形機器人深度整合,提
供實時推理和決策支援。例如,Optimus 可能利用 Grok 4 的視覺場景推理能力,提升自
主行為表現。
[](
https://news.futunn.com/en/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)[](https://news.futunn.com/post/58878585/musk-will-live-stream-the-release-of-grok-4-at)
- 此外,Grok 4 的 API 將為開發者提供更多可能性,可能支援應用程式開發和智慧
代理工作流。
[](
https://content.techgig.com/technology/grok-4-launch-july10-livestream-xai-elon-musk/articleshow/122314148.cms)
9. **爭議與改進**:
- 直播可能回應了此前 Grok 3 在政治偏見和錯誤資訊上的爭議。馬斯克曾批評
Grok 3「模仿傳統媒體」,xAI 承諾 Grok 4 將通過強化第一原理推理和公開系統提示(
system prompts)來提升透明度和可靠性。
[](
https://www.teslarati.com/elon-musk-confirms-grok-4-launch-july-9-livestream-event/)[](https://en.wikipedia.org/wiki/Grok_%28chatbot%29)
10. **直播觀感與市場影響**:
- X 用戶 @AI_Whisper_X 提到馬斯克在直播中看起來「憔悴」,反映其對 Grok 4
開發的高強度投入。
- 用戶普遍對 Grok 4 的性能表示期待,認為其成本效益(「任務對成本比」)可能
領先業界,甚至比擬「每個人都能擁有一個研究所」的智慧水平。
### **如何觀看回放**
- 直播於 xAI 官方 X 帳號(@xAI)進行,錄像可能已上傳至 X 平台或 xAI 官網(x.ai
)。建議訪問
https://x.ai 或 xAI 的 X 帳號查看回放連結。
[](
https://x.com/xai/status/1943158495588815072)[](https://www.nextbigfuture.com/2025/07/xai-grok-4-releases-wednesday-july-9-at-8pm-pst.html)
### **總結**
Grok 4 的發布標誌著 xAI 在 AI 競賽中的重大進展,其在推理、編程和潛在多模態功能
的突破使其成為 OpenAI 和 Google 的強力競爭者。直播展示了 Grok 4 的頂尖性能和應
用潛力,但語音功能和細節實現仍需進一步優化。對於開發者和技術愛好者,Grok 4 的
專業化編程模型和 API 支援尤其值得關注。
--
(以上由grok3生成)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.192.198 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1752127127.A.49C.html
2F:→ shin2190: 角色扮演/文字創作一坨X,甚至比Grok 3還不如… 07/10 21:26
3F:→ Supasizeit: Grok po推特文稱讚希特勒 他完蛋了 07/10 22:57
4F:→ hitlerx: 稱讚希特勒為什麼會完蛋 他色色能力若不長進才是會完蛋 07/11 20:57