作者stpiknow (H)
看板Tech_Job
標題[新聞] 亞馬遜、Alphabet、Meta和微軟在AI晶片
時間Mon Apr 29 08:08:28 2024
亞馬遜、Alphabet、Meta和微軟在AI晶片的佈局,長期將帶給輝達麻煩
原文網址:
https://bit.ly/3UfIw3P
原文:
亞馬遜、Alphabet、Meta和微軟是AI雲端運算領域的四大參與者。他們也恰好是輝達GPU
的最大買家之一。可是這四家雲端巨頭的另一個共同點是他們都在製造自己的晶片,尋求
互補輝達無法滿足其AI客製化的供應。
其實,輝達的GPU非常昂貴,所以四家雲端供應商都希望並且需要控制不斷飆升的資本支
出預算。Meta、微軟、亞馬遜和Alphabet 在AI基礎設施上投入了大量資金。根據
FactSet估計,2024財年這四家的資本支出總計預計將達到1,780億美元,比2023年增加
26%以上。唯有透過設計自己的解決方案來實現,涵蓋軟體、硬體和晶片的大部分成本。
以亞馬遜為例,其於2015年透過收購以色列晶片設計公司Annapurna Labs進軍晶片業務。
這筆交易最後產生了三種晶片:一種名為Graviton的CPU,亞馬遜稱其性價比比同類x86晶
片高出40%;用於訓練LLM的Trainium;以及用於AI推理工作負載的Inferentia。
亞馬遜也投資OpenAI的敵手Anthropic。如今Anthropic用Trainium來訓練其AI模式。
Airbnb、位元組跳動、Snap和德國電信都是 Inferentia 的客戶。 亞馬遜使用自己的晶
片來運行 Alexa、亞馬遜廣告及其新的 Rufus 購物機器人。
Alphabet 旗下的谷歌近十年來一直在開發AI晶片,且創建完整系統的優勢,不僅是晶片
,還包括相關的軟體、網路基礎設施和儲存。谷歌將其晶片稱為TPU(Tensor Process
Unit)。谷歌正在開發第五代TPU,它有兩種類型,一種專注於效能,另一種則針對效率
。
谷歌使用TPU建立大型語言模型,包括其廣泛部署的Gemini軟體。它還依賴TPU來驅動
Google Mail和其他服務。 許多依賴Google TPU的新創公司包括製造個人化聊天機器人的
Character AI和提供文字到圖像軟體的Midjourney。
Meta則是推出了第二代AI晶片,稱為MTIA(Meta Training and Inference Accelerator
)。Facebook和Instagram都正在使用MTIA晶片來支援社群媒體排名和廣告模式。Meta表
示,MTIA 是一項長期事業,旨在為 Meta 獨特的工作負載提供最高效的架構。
至於微軟,其於2023年推出了Azure Maia 100 AI Accelerator,這是一款用於模型訓練
和推理的晶片。到目前為止,微軟僅限於內部工作負載的使用。未來微軟將重新構想從晶
片到伺服器到系統再到數據中心基礎設施的每一層,以最大限度地提高效能和效率。
總之,這四家廠商不太可能將其AI晶片販售給其他業者,並與輝達競爭。但是其生產的AI
晶片,仍會逐漸削弱輝達在AI晶片的佔有率,甚至未來的影響力。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Tech_Job/M.1714349311.A.41A.html
1F:→ zzahoward : 長期來說 我們都死惹 04/29 08:40
2F:推 arslanhs : 老黃包圍網 04/29 08:41
3F:→ soliboy : 長期來說 這些公司都會倒 04/29 08:46
4F:推 Raikknen : 頂多自用 04/29 08:52
5F:推 robin101246 : 長期來說 地球會毀滅 04/29 09:02
6F:推 abbei : 長期來說 1+1=2 04/29 09:04
7F:推 rogergon : 就想像是系統廠自己設計軟硬體不走wintel 04/29 09:08
8F:→ rogergon : 從歷史教訓看,很難玩得過老黃的業界標準 04/29 09:09
9F:→ rogergon : 除非像linux+arm做出另一個標準 04/29 09:12
10F:推 yytseng : 現在看winqual會不會成功囉 04/29 09:18
11F:推 ru04hj4 : 六大派圍攻光明頂 04/29 09:19
12F:→ yytseng : 不過在大模型方面他們這幾家都還是買GB200 04/29 09:20
13F:→ tsairay : 只要它們搶不到GG產能就沒用吧,三星和intel明顯 04/29 10:08
14F:→ tsairay : 落後一段距離 04/29 10:08
15F:→ tsairay : 蘋果就死抓著GG產能不放,幫自己未來AI晶片產能卡位 04/29 10:10
16F:推 pponywong : 除非它們在AI佔有率可以到跟蘋果手機一樣 04/29 12:25
17F:→ pponywong : 否則不見得便宜 04/29 12:26
18F:→ tabrisPTT : 這幾間做出來的chip…效能應該慘到不行吧 04/29 12:28
19F:推 agbr2 : 自己做chip是趨勢,好不好是另一回事 04/29 13:00
20F:→ btpeter : 剛開始 哪有這麼快趕上NV 目前最新的GPU B100/GB200 04/29 13:22
21F:→ btpeter : /B200效能… 需要時間 NV也不是花了多少時間才到這 04/29 13:22
22F:→ btpeter : 樣目前位置….但AI solution 絕對不會是只有GPU為主 04/29 13:22
23F:→ btpeter : 流…..ASIC/FPGA/RISC-V 都還是未知數也還在進行中 04/29 13:22
24F:→ btpeter : …. 任何的改變不是一蹴可及…. 04/29 13:22
25F:→ WSY000000000: 目前效能應該差距頗大,效益CP值到的話才有機會。 04/29 14:46
26F:推 PTIMIKE : 還不是要下單GG 04/29 17:28
27F:推 madeinheaven: 三星也要做了 04/29 17:50
28F:→ a27417332 : 什麼業界標準,他們就是想當標準呀 04/29 19:36
29F:→ a27417332 : 雲三家打的算盤就是把AI服務拿來賣 04/29 19:37
30F:→ a27417332 : 只要把模型遷移到自家硬體上順順跑就好 04/29 19:38
31F:→ a27417332 : 只是順不順利就是另一件事了 04/29 19:44
32F:→ a27417332 : 補述一下,第一句前面說的是底層後面說的是AI服務 04/29 19:51
33F:→ cathychg : 尼們忘了 還有雅虎噢。亞美利堅合眾合國 04/29 19:58
34F:→ Alwen : 就當初手機晶片潮再走一次而已 04/29 21:00
35F:→ Alwen : 三四年後一堆就說不玩惹 04/29 21:01
36F:→ sachialanlus: 應該會做特質化的處理器 像是 TPU LPU 那種 不然 GP 04/30 02:45
37F:→ sachialanlus: U 短時間內應該是沒辦法追上 04/30 02:45
38F:→ btpeter : ASIC 自己做作業 …. 04/30 07:50