作者littleshan (我要加入剑道社!)
站内hardware
标题Re: [News] intel Conroe核心实物图与预售价格
时间Mon Feb 6 22:21:33 2006
※ 引述《oijkue (中肯!! (乡民调))》之铭言:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc)
: ◆ From: 219.84.132.86
: 推 Kent:谣言本部若讲的是真的 netburst p4身价暴跌时间就快了 02/06 20:47
: 推 oijkue:这应该还好,有些工作还是要高时脉的cpu才比较适合 02/06 20:49
sorry
我现在还是对这样的说法不以为然
其实 CPU 的时脉 只要 clock generator 能产生
理论上要多高就可以多高
只是 function unit 不一定跟得上
所以时脉不代表效能
为什麽 P4 在转码工作上的表现
一般而言会比 K8 或 P-M 还快呢
绝对不是单纯因为他的时脉高
最重要的是他的浮点运算元是实在的 128bit
理论上一个 cycle 就可以处理四个 single precision float
这在大量用 SSE 最佳化的转码软体上会非常有利
反观 K8 的运算元只有 80bit
因此需要两个 cycle 才能处理相同的动作
用 Sandra 里面的 multimedia benchmark 就可以轻易确认这个事实
但为什麽许多浮点运算还是 K8 胜出?
因为用 SSE 把所有浮点运算向量化是非常不容易的工作
现在的 compiler 几乎都无法做到 (除非你用 intel 的 compiler)
所以一般的浮点运算中
K8 的 80bit 运算元已经够用了
至於 P-M
则是败在它的 instruction decoder 虽然有三组
却只有一组能处理 SSE/SSE2 instruction
就像一个老饕 虽然吃东西很快
但如果上菜速度很慢 他还是只能细嚼慢咽一般
事实上 这些用 SSE 最佳化的工作
通常都属於 stream processing 的范畴
如果可以在 GPU 上实作
理论上效能可以轻易超过 CPU
别忘了 GPU 的时脉是远远落後 CPU 的 (600 MHz算是很高了)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.140.43.194
※ 编辑: littleshan 来自: 220.140.43.194 (02/06 22:22)
1F:推 milen:快了...PCI-E的下传频宽够大...看那时要写出软体来 02/06 22:29
2F:推 oijkue:谢谢指教 希望Conroe能够具备两者的优点 02/06 22:30
3F:推 cutemaumau:大推 很详细 02/06 22:44
4F:推 mestelqure:好文推!! 02/06 23:47