作者tint (璇月)
看板PC_Shopping
標題Re: [閒聊] AMD你也有大小核出問題的一天啊
時間Wed Jul 31 11:05:05 2024
※ 引述《mayolane (沒有人啦)》之銘言:
: Ryzen AI 9 HX 370有Zen5*4+Zen5c*8
: 主要的問題是Zen5和Zen5c在兩顆CCD上
: 彼此用Infinity Fabric連接
: https://i.imgur.com/acR8B42.jpeg
: 然後彼此之間通信延遲鋼彈180 ns
: 要知道7950X兩顆CCD的延遲也才79 ns
在前代Zen4架構
消費級首次用上Zen4+Zen4c大小核的
Phoenix 2 APU(7545U/7440U、Z1、8500G等使用)
Zen4+Zen4c大小核是位於同一個CCX上
https://i.imgur.com/8PqjH3e.jpeg
6個核心共用16MB的L3快取
雖然大核Zen4對比桌面版L3快取縮小
但整個CCX共用16MB的L3
4個Zen4c每核平均也能分配到2.6MB的L3
以桌面的8500G為例
Zen4c小核的最高時脈為3.7GHz
參考一些評測,跨小核的延遲並未明顯增加
Phoenix 2 APU的Zen4c
在應用上就是時脈較低的核心
這次的Zen5 Strix Point APU
配置4個Zen5+8個Zen5c大小核,總共12核心
其中4個Zen5大核心
給到和桌面一樣完整的L3(每核平均4MB)
但8個Zen5c小核,則精簡到僅8MB L3
每核心平均只有1MB L3
依之前AMD公佈的投影片說明
https://i.imgur.com/8b3nqmH.jpeg
這次4個Zen5和8個Zen5c
分別為二組獨立的CCX
4個Zen5的CCX共用16MB的L3
8個Zen5c的CCX則只共用8MB的L3
二組CCX彼此使用Infinity Fabric相連
有點類似以前Zen2時的設計
Strix Point APU這樣的雙CCX配置
導致跨二組CCX上核心存取時
會受限於Infinity Fabric的頻寬
跨CCX的延遲和頻寬可能會受不小影響
而且Zen5c的CCX僅有8MB L3快取
大小核效能的落差可能更凸顯出來
在6月時一篇Ryzen AI 9 365偷跑詳細測試中
就能看出這次雙CCX設計的特徵
https://blog.hjc.im/zen5-preliminary-review.html
Ryzen AI 9 365這顆APU為Strix Point核心
遮蔽2個Zen5c小核
為4個Zen5+6個Zen5c總共10核心的配置
文章中跨二組CCX的同步測試
https://i.imgur.com/zIrijeT.jpeg
可觀察到跨到CCX時的延遲和頻寬
都有明顯受影響的情形
延遲增加至170ns
頻寬從28000MB/s左右降至9000MB/s等級
Strix Point這次的雙CCX設計
在跨CCX的應用上
可能也抵銷了一些這次給到4個滿規
Zen5核心的性能優勢
不過Strix Point的能效表現仍是不錯的
Strix Point雙CCX的架構
AMD在設計初應就知會有這情形
但Strix Point主要面向移動端產品
配置12核心和16CU RDNA3.5內顯
各方面都已有不少提升了
明年還會有一顆面向主流市場
原生8核心Zen5 APU「Kraken Point」推出
配置4個Zen5+4個Zen5c的大小核設計
內顯是8CU規模,NPU維持50TOPS算力
看起來非常適合掌機和低功耗裝置
到時可以觀察看看這一顆APU
大小核會不會回到採用單CCX的設計了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.173 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/PC_Shopping/M.1722395107.A.5F0.html
※ 編輯: tint (123.204.6.173 臺灣), 07/31/2024 11:21:06
1F:推 canandmap: 推解說,所以延遲高的原因看起來似乎 36.228.160.137 07/31 11:20
2F:→ canandmap: 就是L3不夠+IF頻寬不足,導致這樣的結 36.228.160.137 07/31 11:21
3F:→ canandmap: 果發生 36.228.160.137 07/31 11:21
4F:推 smallreader: IF頻寬高要更耗電所以頻寬給很少嗎111.254.174.244 07/31 11:43
5F:推 SHR4587: 下一代移動端應該就是改進延遲問題了 111.241.189.9 07/31 11:46
6F:→ SHR4587: 這次就算有延遲問題整體表現還是很亮眼 111.241.189.9 07/31 11:47
7F:→ SHR4587: 遊戲是可惜了,但會買這類型產品的遊戲 111.241.189.9 07/31 11:47
8F:→ SHR4587: 應該都是附加價值吧 111.241.189.9 07/31 11:47
9F:推 avans: 推解說114.137.200.253 07/31 11:48
10F:推 bunjie: 推詳細解說 111.82.220.142 07/31 11:53
11F:推 Arbin: 遊戲筆電大概還是得要等全大核或是單CCX 111.71.212.194 07/31 12:31
12F:推 oopFoo: 筆電的cpu功耗最重要。現在分成兩個ccx, 36.224.200.235 07/31 12:39
13F:→ oopFoo: 一個是lowish power island,平常就用這個 36.224.200.235 07/31 12:40
14F:→ oopFoo: 高功耗的ccx可以關掉。你串在一起無法關掉 36.224.200.235 07/31 12:41
15F:→ oopFoo: 省電。ringbus很耗電的。上一代的反應不好 36.224.200.235 07/31 12:41
16F:→ oopFoo: 就是功耗降不下來。這個跟MTL的lpe有點像 36.224.200.235 07/31 12:42
17F:→ oopFoo: 但MTL的兩顆ecore太少了。 36.224.200.235 07/31 12:42
18F:推 oopFoo: 以後主流一定是要分流的 36.224.200.235 07/31 12:50
19F:推 smallreader: AMD好像是Mesh但我資訊很久沒更新了111.254.174.244 07/31 13:18
20F:→ smallreader: 哦是在說Intel P/E核同在ringbus耗電111.254.174.244 07/31 13:27
21F:→ higali: 筆電功耗很重要不能像桌面端那樣 219.71.95.18 07/31 13:47
23F:→ pig: anandtech 有把前一代的 latency 拿來做對照218.161.120.232 07/31 14:02
24F:→ pig: 延遲變高,但效能還是把前一代壓在地上打啊218.161.120.232 07/31 14:10
25F:推 SHR4587: 主要是遊戲方面這顆就是夠用就好 111.241.189.9 07/31 14:15
26F:→ SHR4587: 這問題目前看起來就有但不妨礙他是一顆 111.241.189.9 07/31 14:15
27F:→ SHR4587: 很強勁的SOC這樣,下一代能改善是更好 111.241.189.9 07/31 14:16
28F:推 mtc5566: RingBus和Mesh都是Intel的架構 AMD就是CC 118.231.208.21 07/31 14:46
29F:→ mtc5566: X和IF架構 118.231.208.21 07/31 14:46
30F:→ smallreader: 看過說Zen3(?) 8C CCX的拓樸為非全連111.254.174.244 07/31 14:55
31F:→ smallreader: 結的mesh111.254.174.244 07/31 14:55
33F:→ oopFoo: Zen3最大的改良就是ringbus。 36.224.200.235 07/31 15:03
34F:推 mayolane: oop又要來懂得都懂了嗎223.136.225.219 07/31 15:04
36F:→ smallreader: 原來是..官方說ring但評測認為非單純111.254.174.244 07/31 15:04
37F:→ smallreader: ring111.254.174.244 07/31 15:04
38F:→ smallreader: 我直接跳成mesh抱歉XD111.254.174.244 07/31 15:04
39F:→ oopFoo: 你那個ring跟cache的ringbus是不同的東西 36.224.200.235 07/31 15:05
40F:→ smallreader: 哦!ring是A-B-C...接力相連 ringbus111.254.174.244 07/31 15:12
41F:→ smallreader: 是地鐵站嗎111.254.174.244 07/31 15:12
42F:推 oppoR20: 最喜歡看兩家粉絲吵架了 兩邊信仰都很純223.139.119.128 07/31 15:15
43F:推 oopFoo: 所以我不想再講了,不是來鬧場,就是真的 36.224.200.235 07/31 15:21
44F:→ oopFoo: 完全不懂。 36.224.200.235 07/31 15:21
46F:→ smallreader: 第10頁,所以正解ring bus XD111.254.174.244 07/31 15:23
47F:推 smallreader: 獻醜了,原來是說AMD L3快取一個環跟111.254.174.244 07/31 15:41
48F:→ smallreader: Intel環上還有IMC,QPI,IO等站 不一樣111.254.174.244 07/31 15:41
49F:→ smallreader: AMD不會為了cross CCX問題去開發12個111.254.174.244 07/31 16:00
50F:→ smallreader: 核的CCX,只有Zen3那次革新 4→8核,111.254.174.244 07/31 16:00
51F:→ smallreader: 要堆核心就用IF連結每個[至多8核]CCX111.254.174.244 07/31 16:00
52F:推 smallreader: Phoenix 2 APU那張圖由於是2*Zen4+4*111.254.174.244 07/31 16:04
53F:→ smallreader: Zen4c,6個核所以也能容納一個CCX內111.254.174.244 07/31 16:04
54F:→ smallreader: 16MB可能是拆成大核4MB*2+小核2MB*4111.254.174.244 07/31 16:15
55F:推 sdbb: 羅技無線裝置省電,且有bolt,鍵鼠共用 112.104.64.201 07/31 16:25
56F:→ sdbb: 抱歉推錯篇 112.104.64.201 07/31 16:26
57F:→ smallreader: 查到Bergamo的Zen4c也是每核有2MB L3111.254.174.244 07/31 16:29
58F:→ smallreader: 但Zen5c一個CCX可以上到16核各1MB L3111.254.174.244 07/31 16:29
60F:→ tint: 之前oopFoo網友po的Phoenix2 (Z1)情報 123.204.6.173 07/31 17:01
61F:→ tint: 大小核都在同一個Ring上 共用完整16MB L3 123.204.6.173 07/31 17:02
62F:→ tint: 比如R3 7440U這顆4核心APU 參考AMD官網資料 123.204.6.173 07/31 17:05
63F:→ tint: 只有1個Zen4+3個Zen4c(Phoenix2遮蔽下來的) 123.204.6.173 07/31 17:06
64F:→ tint: L3也進一步砍成4個核心共用8MB L3快取 123.204.6.173 07/31 17:06
65F:→ smallreader: 看↑推文以前猜Zen5c L2會不會減半,111.254.174.244 07/31 17:11
66F:→ smallreader: 現在確定維持1MB,是不是其他細節也111.254.174.244 07/31 17:11
67F:→ smallreader: 跟Zen5一樣,還算是同質核心?111.254.174.244 07/31 17:11
68F:→ tint: 我也覺得這次Strix Point直接採用雙CCX設計 123.204.6.173 07/31 17:13
69F:→ tint: 可能AMD是為了省事 像之前Zen3 Cezanne APU 123.204.6.173 07/31 17:16
70F:推 smallreader: ^看來L3的slice不是一定要4+2*3=10MB111.254.174.244 07/31 17:18
71F:→ smallreader: 因為都在ring上共用 延遲週期也一樣111.254.174.244 07/31 17:18
72F:→ smallreader: 然後遵守2的倍數比較簡單111.254.174.244 07/31 17:18
73F:推 kenny72014a: 如果省電是動態關CCX就猛了 27.240.233.40 07/31 17:20
74F:→ tint: 可能直接從Zen2 Renoir APU的晶片配置上 123.204.6.173 07/31 17:21
75F:→ tint: 替換成Zen3 CPU架構的CCX配置來延續晶片設計 123.204.6.173 07/31 17:23
76F:→ tint: 因為對比Cezanne APU和Renoir APU的Die shot 123.204.6.173 07/31 17:25
77F:→ tint: Zen3 Cezanne的Die上有一塊沒功能的區域 123.204.6.173 07/31 17:25
78F:→ tint: 所以AMD省事省設計也不是一二次了 123.204.6.173 07/31 17:26
79F:推 smallreader: Cezanne從Renoir搬過來 有很多留白處111.254.174.244 07/31 17:27
81F:→ tint: Zen5c更多資訊就看看Kraken Point設計如何了 123.204.6.173 07/31 17:29
82F:→ tint: 畢竟這次Strix Point晶片據說成本不低 123.204.6.173 07/31 17:30
83F:→ tint: Kraken Point可能是更面向主流市場的晶片 123.204.6.173 07/31 17:30
84F:→ tint: 8000G系列下一代桌面版APU 也可能會用Kraken 123.204.6.173 07/31 17:32
85F:→ smallreader: 先猜Kraken Point有2CCX,4個Zen5c的111.254.174.244 07/31 17:35
86F:→ smallreader: CCX砍半剩4MB L3111.254.174.244 07/31 17:35
87F:→ tint: 我覺得Kraken的4個Zen5大核可能仍會精簡L3 123.204.6.173 07/31 17:40
88F:→ tint: 就像過往Zen4、Zen3那樣共用16MB L3的設計 123.204.6.173 07/31 17:41
89F:→ tint: 這樣的設計大小核仍在同一個CCX上機率不低 123.204.6.173 07/31 17:45
90F:→ tint: Kraken APU設計方向可能成本能省則省 123.204.6.173 07/31 17:46
91F:推 smallreader: 了解 而且16MB對任何一個核都是足夠111.254.174.244 07/31 17:48
92F:→ smallreader: 有可能真的精簡化1CCX 16MB111.254.174.244 07/31 17:48
93F:→ smallreader: 甚至測cinebench少掉的L3都不影響XD111.254.174.244 07/31 17:55
94F:推 Windcws9Z: 重點就是比上一代又強又省電 End 59.127.190.36 07/31 18:57
95F:推 oopFoo: Kraken Point不知還會不會出。現在全力在 58.114.66.74 07/31 19:26
96F:→ oopFoo: AI上。Strix其實不錯,4大核8小核是蠻平衡 58.114.66.74 07/31 19:27
97F:→ oopFoo: 的設計。遊戲本來就不是筆電的重點。 58.114.66.74 07/31 19:28
98F:→ justicebb: 拉這麼遠勢必受到物理性質限制,要克123.110.195.144 07/31 21:25
99F:→ justicebb: 服就是增面積跟更耗電更熱123.110.195.144 07/31 21:25
100F:→ friedpig: 再怎麼樣做得比跨die還慢就是有點誇張了 114.32.196.169 08/01 00:17
101F:→ friedpig: 沒chiplet能搞到延遲比過PCB還慢 有點 114.32.196.169 08/01 00:17
102F:→ friedpig: 神奇 114.32.196.169 08/01 00:17
103F:→ mtc5566: 神奇什麼? 啊就為了省電阿 118.231.208.21 08/01 01:44
104F:→ mtc5566: 比較神奇的是延遲低但跑遊戲還是輸的Inte 118.231.208.21 08/01 01:44
105F:→ mtc5566: l 到底幹什麼吃的? 118.231.208.21 08/01 01:44
106F:→ canandmap: 孫燕姿:好~~~~~~神~~~~~~奇~~~~~~~~ 36.228.133.92 08/01 11:17
107F:→ tint: Strix Point這顆如果拿來覆蓋中低階產品 123.204.6.173 08/01 19:21
108F:→ tint: 成本應該是偏高的 中低階需要一顆更小核心 123.204.6.173 08/01 19:23
109F:→ tint: Kraken Point這顆是更精省取向的核心 123.204.6.173 08/01 19:25