作者sitos (麦子)
看板Gossiping
标题Re: [问卦] 有没有AMD的八卦
时间Fri Jul 31 02:19:33 2009
※ 引述《SkyElder (不可有一丝恶念)》之铭言:
: AMD最近真的是被打假的 多核心同时脉效能都输30%左右
: 应该不是说最近
: 应该说两年有了
: 更久以前AMD的同时脉效能是领先INTEL的 也就是说如果同样是跑2G
: AMD效能硬是比较快 所以他才出了一堆类似 型号是3500结果实际时脉只跑2.2G
: 玩这种把戏 就是宣称自己的2.2G可以跑得跟INTEL的3.5G一样快
: 事实上是没有一样快 可是也差不多了
intel 在 p2~p4 的时期,应该都还算是在冲 clock rate ,
要把 clock rate 冲上去的方法就是让每一个 pipeline stage 更短,
当然相对地,做完一件事的时间需求一样, pipeline 的深度就会变深。
透过这样的方式,可以很漂亮地让 clock rate 冲上去。
当时的市场看到 clock rate 就爽了,爽大家就买,效能进步其实未必很大。
pipeline 当然是增加 instruction level parallelism 的好方法,
至少课本都是这样教的,适当地去切 pipeline 其实表现也都不错。
不过 intel 把这个观念玩到极致,或者说是有点过头了。
一般课本会教的大概是 5~6 stage 的 pipeline ,
intel 切到後来大概切到 20~30 个 stage 。
如果程式的 instruction 之间真的都是 independent ,
那麽 20~30 stage 的 pipeline 效能应该会还满不错的。
但是因为一些 data/control dependency ,
导致前後的 instruction 其实要互等, pipeline 执行常常在 stall 。
切了一堆 stage ,但大家都在 idle ,对效能根本没帮助。
更惨的是,这些在 idle 的 unit 还是很认真地在等工作,
所以继续在耗电,这种烂方法搞到後来就是出现像 pentium D 这种,
又吃电又热跑起来又不怎麽快的 cpu 。 intel 自己也知道这样不行了,
因为这样搞下去 power 都快要比 cpu 还要贵了。
所以才换个方向,走向 pipeline 比较不那麽深的设计方式。
早年 amd 用的策略就是跟 intel 不一样,没有强加 pipeline stage 。
所以才会有所谓「同时脉」比较快,但基本上同时脉没什麽意义,
时脉本来就是看你在一个 cycle 要做多少事来决定的。
intel cpu 一个 cycle 做的事比较少,所以要用比较多的 cycle 才做完。
amd 则反过来。但基本上做完一件事所需要的时间差不了太多。
真正决胜的点还是每一个 function unit 本身的设计,
不过这些东西使用者是看不到的。
: CPU要快除了时脉以外 最重要的就是内部的构造与技术 时脉并不是关键
: 但近来INTEL出了新核心(从core 2技术开始) 用了新技术 把整个局势扭转过来了
: 也就是说 同时脉下 效能会赢AMD 30%左右
: 又 INTEL制程比较先进 比如INTEL 是45奈米但AMD只有65奈米
: 45奈米在相同时脉下 比65奈米省电1/3 当然温度也低
: 速度也会增快(因为电路间隙缩短传递更快)
其实前阵子 core/core2 把 amd 搞得很惨的原因除了制程,
还有很重要的是 intel 有把两个 die 放在同一个 package 里面的能力。
也就是所谓的非原生双核心/四核心。当出 amd 在广告上面呛 intel 不是原生四核。
不过就是因为不是原生四核,所以四核需要的是两个小 die 不是一个大 die ,
die 的成本和面积平方成正比,拆开来作就便宜多了。
再加上非原生四核的缺点主要是差在 core-to-core 的沟通上面。
不过一来是实际使用平行程式的使用者不多,未必感受得到差异。
二来是,管理作得好一点,差别也没有真的太多。
而可怜的 amd 因为没有这种技术,所以硬要一次作四核,
在制造过程中要保证一整个大的 die 都是好的,成本就上去了。
卖得贵又跑得没快多少,谁要跟你买。 XD
有人说 amd 搞三核心就是为了压低售价,只坏掉一个核心的还是可以拿来卖。
不过我没有去看过 spec ,不知道是不是真的这样搞。
因为那麽产品连我的好奇心都没挑起来。
: AMD最近完全是靠显示卡在撑
: AMD(ATI)的显示卡蛮威的
: 虽然我用INETL的四核 但我买AMD的显示卡
: ATI的显卡最近很威 具有高CP值与高画质 把Geforce整个打趴了
事实上再过一阵子, amd 可能都还是得要靠 gpu 来撑。
依照目前 gpgpu (general purpose gpu)的发展来看,
独占鳌头的应该是 nvidia 的 cuda 。
但是 cuda 架构有一个很大的缺陷,因为 cuda 在运算的时候,
资料和程式都必须要放在 gpu 的记忆体里面,虽然 size 也是问题,
但不是最大的问题。最大的问题在於这些程式和资料,
必须要先从 main memory 搬到 gpu memory 上面。
而算完之後,还要从 gpu memory 再搬回 main memory 。
很多不是真的计算量很大的程式,搬的时间就比算的时间还久。
这种程式用 cuda 不会有加速的效果。
因此可能的方向应该是要让 gpu 也可以存取 main memory 。
早先的 intel system 是把 memory controller 放在 north bridge 上面,
可行的作法是把 gpu 也放在 north bridge 上面。
以前内建显卡有的就这样做,然後扣掉一点 main memory 的大小。
如果这块不是被「切出去」,而是共享。
那麽就可以让 gpu 不用花额外的时间去「搬」资料。
但是 intel 不太可能让 nvidia 染指自家的 north bridge ,
不管是专利或是介面, nvidia 作为 intel 主要对手之一,合作是要很小心的。
而现在这个可能性又更小了,因为从 core i7 之後,
memory controller 已经做在 cpu 里面。
事实上先这样做的是 amd ,但这只是设计的决策不同,
intel cpu 现在才有这个需求,所以现在才作这种整合。
那麽 intel cpu 更不可能跟 nvidia gpu 做在一起。
所以 intel 只能期待自己的 gpgpu 可以跟上 nvidia 跟 ati 。
那东西的名字是 larrabee ,但现在看起来跟一般的 cpu 还差得远。
(详细的资料可以查 wikipedia 或 google 一下,
很有趣的是它是一个用 x86 instruction set 的 gpu)
而 amd 的好处是有了 ati 的技术,可以把 cpu/gpu 做在同一块 die 上。
cpu 输 intel 一点, gpu 跟 nvidia 不相上下或再好一点。
透过可以 share main memory ,省去资料搬移的时间,
会让 gpgpu 的应用更有吸引力, overhead 变少, performance 就出来了。
相较於 nvidia 提出 cuda 的架构, amd/intel 之後应该会 follow OpenCL 的规范。
不过目前还不是很具体,但希望未来是有一个统一 cpu/gpu 的 programming model 。
也就是写一份程式,自动会把工作分散到 cpu/gpu 让它们协同工作,
以达到更好的效能。
至少在这一块未来的发展上面, amd/ati 是很值得期待的,
现在就看看 intel 在 gpu/gpgpu 这一块要拿出什麽来应对。
在 gpp (general purpose processor) 上面 intel 已经超强了,
amd 快要不足以被当作对手。不过在 gpu/gpgpu 上面还很嫩。
amd 这块如果能加紧脚步应该还满有机会的,不过目前看起来有点....
该怎麽说呢? 口号喊了一两年,东西却没做出来半个,让人满担心的。
(不过 intel 的 larrabee 也是喊了好一阵子,效能一直长不太出来。 XD
补一下好了,讲错就请纠正。这些东西在头脑里都揪成一沱了...
--
活着的目的是为主活 然後为主死
死亡的目的是为主死 然後为主活
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 60.248.178.71
1F:→ gg123sf:计组计结魂!! 07/31 02:20
2F:→ gg123sf:其实clock rate冲高系统反而容易挂 现在主战场是分工合作 07/31 02:21
我不太确定你说的容易挂指的是哪个部份。如果单纯是同一种架构,
clock rate 高的确可能会因为 technology variation 造成讯号错误的情况。
降频一下,等讯号稳定再读就没问题了。 :)
分工合作的部份我猜你是说用特殊的指令集或 function unit 来加速。
这部份也是做得.... 我个人觉得有点过火了 XD
MMX/SSE/SSE2 之後来有一个什麽来着的... 忘了。
虽然都是 x86 ,但多出来的东西,旧的机器可是一概不支援的。
3F:→ a0801284545:太专业 看无 07/31 02:22
4F:推 sunsonsam:原来clock rate跟pipeline有关联..................... 07/31 02:23
5F:推 magecandy:半吊子乡民:你干嘛讲话不用中文好好讲 要夹一堆英文? 07/31 02:23
6F:推 zoo3021515:专业推 07/31 02:24
7F:→ cloud7515:8核心! INTEL:我多你八核心 07/31 02:24
8F:推 autoupdate:用中文讲 五楼也是看不懂 07/31 02:24
9F:→ sidi:好我看懂一个 时脉 这样可以了可以了吧 07/31 02:24
10F:推 ruemann:他用的英文还可以啦,只是北桥用英文会比较好? 07/31 02:24
抱歉,也许用北桥讲就好了。 :)
11F:推 dingyuchi:推一下 这篇应该要给M 07/31 02:24
12F:→ feizizi:你会不会太猛了啊??? 连GPU你都能投头是道 拜服啊 07/31 02:25
13F:推 GTOKevin:专业推 07/31 02:25
14F:推 captdavince:推啊~接下来就是整合cpu和gpu在同一块上了吧 07/31 02:26
15F:推 pdaer:越跑越快越跑越吃电 以後玩游戏耗电量跟煮火锅一样了 07/31 02:26
要记得买电扇...
16F:推 ruemann:cpu整合gpu……有应用再说吧,m$不支援api的话,就没用了 07/31 02:27
已经有应用了阿。可以到 nvidia 的网站上面找 CUDA 。
如果你有 8400 以上的板子就有支援,可以跑跑它的 demo 程式。
(当然要装一些 nvidia 提供的软体)
会比用 cpu 跑快非常非常多。
而且开发介面也可以跟 vs 整合在一起, m$ 没道理去挡这东西,
对他们一点坏处也没有。 :)
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:31)
17F:推 sunsonsam:不太懂时脉跟管线深度有什麽关系 时脉不是震荡器给的吗 07/31 02:27
时脉的极限是来自於一个逻辑电路的讯号多久稳定到可以被读出来,
而讯号稳定取决於线路的长度还有一些设计相关的参数,
我不是做 EDA 的,所以细节不是非常清楚。
用一个过度简化(不真实)的讲法来讲,假设你要做的事情有五件事,
每一件事要做一秒,你五件事永远要一起做,你就是要花五秒才能做完一件事。
而且因为五件事都一定要一起做,所以同时也只能做其中的某一件。
如果你可以把五件事拆开给五个人做,每一个人做一件事,就只需要一秒。
第一个人做完,就把事情交接给第二个人,他又可以再去做另一件事。
而这时候,我们可以把交接想像成一个检查点,也就是一个时脉周期。
所以,事情拆得越散,做完「一件」需要的时间就越短,时脉就可以越高。
大致上的概念是这样子,实作上当然还有很多其它需要考量的问题。
英文用少一点会比较好吗 :)
18F:推 OpenGoodHate:底层达人出没请小心 07/31 02:28
19F:→ feizizi:八卦就是要有这种水准的文章才high啊~~~ XDDDDDDD 07/31 02:28
20F:推 reallocust:4850的GPU已经够拿来煮火锅了...(X的,现在房间超热的) 07/31 02:28
21F:推 mike1990:看完了 还是看的懂耶 呵呵 07/31 02:29
22F:推 fin806:GPU->CPU山寨板 比CPU威 还可以煮火锅 07/31 02:29
23F:→ OpenGoodHate:22台i7+GTX275 开下去冷气会滴水 07/31 02:30
24F:→ kslman:下次整篇英文才不会被酸 07/31 02:30
25F:推 allen7976:I 怎麽都 watch 不懂... 07/31 02:30
26F:推 AAAA:很多东西翻成中文反而会更不顺 07/31 02:30
27F:推 eric93: 07/31 02:30
28F:推 HornyDragon:酸的人可以把这篇的英文都翻成中文试试看...... 07/31 02:30
29F:推 skciv:白算盘 07/31 02:31
30F:→ OpenGoodHate:GPU有自己的核心,记忆体跟板子,但是还不能宣布独立 07/31 02:31
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:35)
31F:推 ikari512:推 autoupdate:用中文讲 五楼也是看不懂 07/31 02:32
32F:推 asgard1991:只能推了 囧"> 07/31 02:32
33F:推 leopastiom:赶快推 不然人家以为你看不懂!!!!!!!!!!!!!!!!!!!! 07/31 02:32
34F:→ ikari512:不然5F翻成中文来看看呀。 07/31 02:33
35F:推 tonyselina:前面两段是计概必念的圣经白算盘第四版吗? XDDDDDDDD 07/31 02:33
不知道。我只知道计结课本考试范围考前我一个字一个字念过了。念完,就忘了。
36F:推 sunsonsam:GPU搬MEM的部份 似乎把记忆体加大就可以解决? 07/31 02:33
加大不是很有用,基本上问题是出在,有些事 gpu 不能做(或说 cpu 做才快),
有些是 cpu 不能做(或说 gpu 做才快),为了要快,就要一直交接事情(搬资料)。
问题不在於资料放不下(如果是放不下加大就好了),问题是在於搬来搬去。
就像是你要跑公文,公文量可能不是很多,如果公文量太多,大不了用大一点的袋子。
但是你要把公文在各单位之间跑来跑去,就算公文只有一份,还是很花时间。
37F:推 Atzivan:宽度一样,长度改变的管子,流速会变快吗? 07/31 02:34
38F:推 ertyhnm:专业文推 07/31 02:34
39F:推 VictorTom:推专业:) 07/31 02:34
40F:推 ruemann:要搬移就要时间,不管是用dma还是什麽鬼方法都不会比share 07/31 02:34
41F:→ ruemann:快吧 07/31 02:34
42F:→ tonyselina:这边要帮糖糖说话,他是模拟半调子吧? XDD 07/31 02:34
43F:推 SILee:to sunsonsam:因为要拉时脉就必须要缩短stage 07/31 02:34
44F:推 kingofsdtw:看 八卦长知识 07/31 02:35
45F:推 herman602:5专业 07/31 02:35
46F:→ sunsonsam:不会 但是水全部都在管子里面就不用到外面去拿 = 变快 07/31 02:35
47F:推 ikari512:糟糕 好像真的是反串 我酸错人了XDrz 07/31 02:35
48F:→ SILee:问题是要做的事情还是一样多,所以pipeline会变深 07/31 02:35
49F:→ ikari512:5F有个分号 整句文意都变了 囧!! 07/31 02:36
50F:推 ogcxd:I服了YOU 07/31 02:36
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:39)
51F:推 ruemann:pipeline太深,如果碰到要清空pipeline时,代价也变高 07/31 02:36
52F:→ sunsonsam:SILee 意思是stage过大而时脉过高容易出错 是这样吗= = 07/31 02:36
53F:推 choupi:y老师lab的强者出马 当然要开本尊上来推一下!! 07/31 02:37
54F:→ SILee:sunsonsam你是EE或CS相关科系出身的吗? 07/31 02:38
55F:推 tonyselina:刚刚翻了一下,是白算盘第六章内容、、、 07/31 02:38
56F:推 ikari512:sunsonsam:时脉高不代表容易出错 而是出错的话会很痛 07/31 02:39
57F:推 tnav:是麦子大 ... 07/31 02:39
58F:推 gg123sf:这种东西好像只有电机电子资工在学的样子.. 07/31 02:39
59F:→ SILee:如果不是的话很难跟你解释这个观念 0rz 小弟不擅长教学 07/31 02:39
60F:→ ikari512:sunsonsam应该不是 所以可以练习用白话文解释看看XDD 07/31 02:39
61F:→ ikari512:我要修正一下 是stage太多会很痛 跟时脉不直接相关orz 07/31 02:40
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:40)
62F:推 ukimiu:推!!看得非常舒服,精辟好文!!值得M XD 07/31 02:40
63F:→ sunsonsam:我是EE 我知道clock太高会有东西跟不上就出错 07/31 02:41
64F:→ SILee:而且这要画图会比较好解释,BBS很难画图 07/31 02:41
65F:→ sunsonsam:可是我不知道跟pipeline有什麽关联= ="我知道我没学好XD 07/31 02:41
66F:→ SILee:是EE出身的话你该去重K白算盘啦 = =" 07/31 02:42
67F:推 Assyla:计组魂 07/31 02:42
68F:→ sunsonsam:XDDDDD 小的知错 07/31 02:42
69F:推 jeta890119:专业推 07/31 02:44
70F:推 costbook:如果能把OS的设计一起分析就更好了 <---嘴炮 07/31 02:44
71F:推 choupi:现在cuda的computing model和cell还蛮像的.. 07/31 02:44
两个都很难写... 而且要最佳化也都有很多要注意的地方。
我个人觉得 CUDA 成功的机会比较大,
有显卡的人应该会比愿意把 ps3 装 linux 的人多。
以 tool chain 来看 CUDA 还跟不上 cell ,不过用的人多,
活下去的话,应该会渐渐越来越齐全就是了。
这种 heterogeneous 的计算平台都很难写。
希望 OpenCL 会解决这个问题。 :)
(不过还好其实我不用写)
72F:推 windward:白算盘看得很熟哦XD 07/31 02:44
73F:推 LoLoLuan:写的让小学五年级看不懂 就是废文了... Change有没有看过 07/31 02:45
对不起... 才疏学浅,还没办法做到深入浅出的程度。 :)
※ kof2200:转录至看板 PC_Shopping 07/31 02:45
74F:→ SILee:简单讲就是要拉时脉的话单一stage内部的delay要缩短 07/31 02:45
75F:推 johnlinvc:pipeline方面 现在branch prediction的进步也是关键之一 07/31 02:45
76F:→ LoLoLuan:要把眼光拉到五年及小学生一样高啊.. 07/31 02:45
77F:推 ruemann:这个能写到让小学五年级看得懂的话,那个长度会想让人end 07/31 02:45
78F:推 DieWalkure:AMD的K6-200不错用阿,我还在用说,K5之前是很烂没错 07/31 02:46
79F:→ SILee:所以一个stage所能做的事情就会变少 07/31 02:46
80F:推 jazzboy:电机学过也不见得记得 後来没走系统组都忘光了 07/31 02:46
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:49)
81F:→ DieWalkure:K7之後有度还超越Intel一下不是 !? 07/31 02:46
82F:→ SILee:但是对同一个instruction必须要完成动作还是那麽多 07/31 02:46
83F:推 gg123sf:这个要写到让小学五年级懂得话 大概花40个小时讲课.. 07/31 02:47
84F:推 costbook:要让大家看得懂,就要从8051开始讲起了 <---再次嘴炮 07/31 02:47
85F:推 LoLoLuan:有没有一言以蔽之的 解释 XD 07/31 02:47
86F:→ SILee:所以就必须增加stage数 07/31 02:47
87F:推 suzukihiro:不错 像P4工程师有一些书 都有写到这些东西 07/31 02:48
88F:推 tonyselina:说实在这个转电虾干嘛? PTT其他板比较适合、、、 07/31 02:48
89F:推 stejiang:上过Y老师的课帮推一下 科科 07/31 02:48
90F:→ LoLoLuan:例如 intel好大喜功,坏坏 AMD偷吃步自以为,笨蛋 07/31 02:48
91F:推 eterbless:把课本讲pipeline的部分转上来就行..就只怕不够宽 07/31 02:49
92F:推 previa:这篇作者对目前发展很了解喔 推一个! 07/31 02:49
93F:推 kony25:you 好厉害 07/31 02:49
94F:推 jesil:看不懂 07/31 02:50
95F:推 costbook:可惜这篇在半夜,不然应该早就爆了 07/31 02:50
96F:→ LoLoLuan:看吧 还是很多人看不懂喔.... :Q 07/31 02:50
97F:推 threedices:专业的八卦版..要是所有文章1/5有这种等级就好了 XD 07/31 02:50
98F:推 jazzboy:例如 intel好大喜功,坏坏 AMD偷吃步自以为,笨蛋 XD 07/31 02:51
99F:推 kingofsdtw:Y老师是?! 矮矮丢香蕉那个@@? 那个满nice的 07/31 02:51
100F:推 ptyan:我竟然看得懂部份耶QQ 07/31 02:51
101F:推 stejiang:文章只有有"马"字就够资格出现在八挂板啦 乡民很爱 07/31 02:51
102F:推 sunsonsam:问个问题 如果STAGE过大而时脉又过高 会怎样? 07/31 02:51
在讯号到达之前读资料,资料会是不稳定的,介於 0,1 之间的值会出错。
你去超频你的电脑,把时脉调到最高,发生的情况,大概就是你上面说的那样。 XD
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:53)
103F:推 gg123sf:那应该会导致错误资讯被传递 之後你电脑就等着升天了.. 07/31 02:52
104F:推 eterbless:浪费时间 07/31 02:52
105F:推 costbook:N年前的电脑杂志也会写这类有深度的文章,现在......... 07/31 02:52
106F:推 feizizi:请问一下die是什麽??? 07/31 02:52
107F:推 kof2200:PTT的真正的好文都麻在深夜过後出来~~ 07/31 02:53
108F:→ SILee:时脉过高你的flip-flop就会存的错误的资料啊 07/31 02:53
109F:→ kingofsdtw:笨笨的问一下..不能直接跳过cpu..直接丢给gpu算吗? 07/31 02:53
目前似乎还没有听到这方面的解法。也许是一个可以尝试的方向,
只是对现在整体电脑产业而言,这样的改变可能会相当痛苦,
一次要改的东西实在太多了。
110F:→ jazzboy:因为白天都被政治新闻占满版面了... 07/31 02:54
111F:→ SILee:die就是从晶圆上面切下来的小电路 07/31 02:54
112F:推 eterbless:两个的结构不一样... 07/31 02:54
113F:→ james0850:好在我有读计组还算看的懂 07/31 02:54
114F:推 choupi:时脉太高应该会到达电子速度的极限 和过热 @@ 07/31 02:54
115F:→ kof2200:die你拿一个CPU出来看他中心有个用铝壳包装的!! 07/31 02:54
116F:→ kingofsdtw:我... 翘很多课= =||| 07/31 02:54
117F:推 ruemann:die = 晶粒,就是晶圆做好後切下来的裸晶粒,封装後就是IC 07/31 02:54
118F:推 sunsonsam:所以就是会出错吗= = STAGE缩短是减少错误机率还是? 07/31 02:54
119F:→ feizizi: 晶圆切下来的小电路?? 有没有更精确的说法??有中文翻译吗 07/31 02:54
120F:→ SILee:你平常看到的CPU和各种IC就是die外面再加上塑胶封装的保护 07/31 02:54
121F:推 Gaogaigar:那些词硬用中文的话可能鞭的人会变多吧? 07/31 02:55
122F:推 gg123sf:stage缩短是为了增加clock rate 07/31 02:55
123F:→ kof2200:政治狂魔因为早上要上班所以会提早入睡了!! 07/31 02:55
124F:→ feizizi:OK~~ 了解了 谢谢 07/31 02:55
※ 编辑: sitos 来自: 60.248.178.71 (07/31 02:56)
125F:推 zoo3021515:是晶粒 不是粒晶喔!! 07/31 02:55
126F:→ choupi:gpu目前还没办法直接存取主记忆体 所以还要cpu去帮忙搬 07/31 02:55
127F:→ SILee:我还真的不知道这些东西要怎麽翻成中文耶XD 07/31 02:56
128F:→ kof2200:午夜过後是真正的好文包含18禁XD 07/31 02:56
129F:推 johnlinvc:正确来说是cmos来不及充放电 因为有电容 07/31 02:56
130F:推 lwei781: Ring oscillator delay 该讲一下.... 07/31 02:56
131F:→ kof2200:SILee那个只能比喻或是形容!! 07/31 02:56
132F:→ apflake:AMD并没有强调同时脉比较快,市场已经接受时脉就是效能错误 07/31 02:57
133F:推 sunsonsam:你们说的clock rate是绕完一圈的还是oscillator的? 07/31 02:57
134F:推 ruemann:AMD那时搞出一个等效计算式,amd的时脉低但等同於intel的 07/31 02:57
135F:推 kingofsdtw:谢~ch大@@~可以搬完不回报cpu吗?!加入新运算记号.. 07/31 02:58
136F:推 gg123sf:AMD有强调的好像是如果型号是1300+ 代表他的效能比intel的 07/31 02:58
137F:→ ruemann:高时脉cpu 07/31 02:58
138F:→ gg123sf:1300还要好 07/31 02:58
139F:推 eterbless:clock rate都是做完一个stage的 07/31 02:58
140F:→ kingofsdtw:但是 好像以线代..来解说..我好像脱裤子放屁~"~ 07/31 02:59
141F:→ sunsonsam:原来是这样= = 我以为是一开始给的... 07/31 02:59
142F:→ SILee:clock rate当然是指oscillator振出来的frequency 07/31 02:59
143F:→ sunsonsam:= = 你们两个去打一架啦XD 07/31 02:59
144F:推 GTOKevin:这边钓出不少专业人士出来 07/31 02:59
145F:→ apflake:概念,所以反而在行销上必须隐藏时脉,例如athlon系列 07/31 02:59
146F:推 lwsun:糟糕,我得找个翻译... 07/31 02:59
147F:→ suzukihiro:那个叫做PR值吧 07/31 03:00
148F:→ SILee:不过灌进CPU的clock,CPU内部还会作升频和除频就是了 07/31 03:00
149F:推 OpenGoodHate:有紫外线抹除的ROM拿来看看就知道什麽叫DIE 07/31 03:00
150F:推 eterbless:找翻译没用 这要从cpu结构开始讲起.. 07/31 03:00
151F:推 james0850:白算盘!!白算盘!!白算盘!!白算盘!!白算盘!!白算盘!! 07/31 03:01
152F:→ OpenGoodHate:不过看完里面的程式也DIE光光,记得拿坏的来玩 07/31 03:01
153F:推 ruemann:要看die的话,拿AMD的某一代CPU就是封一半,半颗die在外面 07/31 03:01
154F:推 costbook:clock为什麽不用PLL送? <---底层达人 07/31 03:02
155F:推 johnlinvc:有关clock就要从外频和倍频来说起了吧 07/31 03:02
156F:推 PRAM:请翻译 Blue who said, and whose. 这句话的中文 07/31 03:02
157F:推 sunsonsam:把cpu的金属盖子拆开就看的到了不是吗 07/31 03:02
158F:→ sunsonsam:楼上不入虎穴焉得虎子 大概10年前的笑话^.< 07/31 03:03
159F:→ kingofsdtw:回RPM: 谁鸟你@@? 07/31 03:03
160F:→ ruemann:快爆了 快爆了 07/31 03:03
161F:→ costbook:金属盖子底下那个是封装好的IC 07/31 03:03
162F:推 gg123sf:PRAM ..此英文非彼英文 07/31 03:04
163F:推 PRAM:楼上年纪大了 (  ̄ c ̄)y▂ξ 07/31 03:04
164F:→ SILee:现在clock不是都用PLL振出来的吗? 07/31 03:04
165F:→ costbook:die算是制程的术语,说明如上↑ 07/31 03:04
166F:→ sunsonsam:我没开过..之前看图是DIE阿@@ 闪亮亮的耶 07/31 03:04
167F:推 choupi:pram=Parallel Random Access Machine 很高深的complexity 07/31 03:05
168F:推 dennis7653:看完这篇的心得就是...以後电脑有问题我都要寄站内信给 07/31 03:05
169F:→ dennis7653:原PO 07/31 03:05
170F:推 zoo3021515:给他爆 给她抱 07/31 03:05
171F:→ SILee:闪亮亮那个是die上的散热片吧 07/31 03:06
172F:推 suzukihiro:报 07/31 03:06
173F:推 ruemann:我爆啦 07/31 03:06
174F:→ sunsonsam:被抢了... 07/31 03:06
175F:→ SILee:真正的die很脆弱的 07/31 03:06
176F:推 kof2200:平行 随机 存取 机器 是吗!? 07/31 03:06
177F:推 feizizi:GKB是什麽机构啊??XDD 07/31 03:06
178F:→ suzukihiro:颗颗 抢走了 07/31 03:06
179F:→ zoo3021515:恭喜铃木大得标 07/31 03:07
180F:→ feizizi: 应该是神人呆的地方吧??? 07/31 03:07
181F:→ kof2200:我只知道KGB 07/31 03:07
182F:推 PRAM:是平行随机没错 XD 板上高人云集 07/31 03:07
183F:→ poppyvodka:完全看不懂 谜之领域 \冏/ 07/31 03:07
184F:推 kingofsdtw:XD~ 原来 Pram ~"~ ...我完全外行 07/31 03:07
185F:推 costbook:我这里还有几颗EPROM和紫外线抹除机,可以看到die喔 07/31 03:07
186F:→ ruemann:我只知道 GBK 07/31 03:07
187F:推 vic81324:有料推 07/31 03:07
188F:推 Cheer313:真专业 给你推 07/31 03:07
189F:推 OpenGoodHate:裸装晶粒应该只有紫外线ROM看的到,剩下都是封装好的 07/31 03:08
190F:→ vic81324:不过变成专业版了颗颗 07/31 03:08
191F:→ SILee:有啦 现在很多生物晶片也都是裸晶直接拿来用 07/31 03:08
193F:→ costbook:不过我把抹除机拿来帮袜子杀菌...(有用吗?) 07/31 03:09
194F:→ SILee:不过这东西市面上应该拿不到 07/31 03:09
195F:推 nfsnfs:Good, 超棒~ 07/31 03:09
196F:推 kof2200:sunsonsam 是的~~ 中间那粒!! 07/31 03:10
197F:推 OpenGoodHate:裸晶不封装要怎麽接脚位出来@@" 07/31 03:10
198F:→ kingofsdtw:原来这就是生物晶片@@ 疑? 07/31 03:10
199F:推 luckystrike5: 盖 07/31 03:11
200F:→ sunsonsam:对阿 那不就是CPU开盖子的东西吗QQ 07/31 03:11
201F:→ kof2200:中间那粒外层还有包装!! 07/31 03:11
202F:→ SILee:那鬼东西是抛弃式的啊,用过一次就丢了 07/31 03:11
203F:→ OpenGoodHate:连结算封装过的不是吗 07/31 03:12
204F:→ kingofsdtw:把 KY弄掉後.. 用指甲刮 就可以看到 裸晶@@? 07/31 03:12
205F:→ SILee:而且那只是用来检测蛋白质的晶片,灌个操作电压进去而以 07/31 03:12
208F:推 upbed:专业推 计算机组织跟计算机结构学得很好唷XDDD 07/31 03:13
209F:→ SILee:还拿去封测厂封装太耗成本了,所以通常都是裸晶直接上 07/31 03:13
210F:→ kingofsdtw:我好奇的是 蛋白呈色如何用晶体取代@@? 商业机密? 07/31 03:14
211F:→ OpenGoodHate:了解,我想到好像RFID的TAG没上封膜前好像也是裸晶 07/31 03:14
212F:推 kof2200:交大的校长说在座的各位可以上"高等 计算机结构学"了XD 07/31 03:15
213F:推 aegis144:英文翻中文那会真的看不懂WW 07/31 03:15
214F:→ SILee:细节我也不太懂,我不是做这个的 07/31 03:15
215F:→ kingofsdtw:了解>\\\< 07/31 03:15
216F:→ kof2200:呼叫原po再来禅释一下!!有问题了~~~ 07/31 03:16
217F:推 choupi:原po可是CA助教级以上的人物呢... 07/31 03:16
218F:推 finkel:CELL和CUDA的程式差很多吧 CUDA的程式不难写..麻烦的地方其 07/31 03:16
219F:→ SILee:只知道它主要是利用电场让蛋白质依它的极性去排列和跑动 07/31 03:16
220F:→ finkel:实是tool还不够成熟..很难debug 07/31 03:17
221F:→ kingofsdtw:不过..要怎样让晶片组直接判断丢给cpu和gpu.(遐想中) 07/31 03:17
222F:→ choupi:kingofsdtw biochip上面是一些binding就会变色的物质 07/31 03:17
223F:→ choupi:finkel 我指的是programming/computing model 07/31 03:18
224F:→ finkel:还有原PO提到的资料传送时间的问题,其实换一个角度来想 07/31 03:18
225F:→ kingofsdtw:所以 生物晶片的辨识仪器 也只是..高级的..辨色?!.. 07/31 03:18
226F:→ finkel:运算和资料量都不高的程式 似乎也较没有使用GPU加速的必要 07/31 03:19
应该说是总运算量高,但资料搬移的需求也多。
资料搬移未必是总资料量大,而是 cpu/gpu 协同工作的时候,
分工上有相依性,导致资料必须要搬来搬去的情况。
至少目前我会认为这种程式不适合用 cuda 架构来加速。
但有没有加速的必要,我认为有。
至於 cuda 难不难写... 我是觉得要写得好还满麻烦的,
必须要对 gpu 底层的运作有些了解才行。不了解当然还是可以照着写,
程式也不会出错,只是快不起来。这样用 cuda 的价值就降低了。
227F:→ kingofsdtw:3D游戏资放:胃口是养大的.. 07/31 03:20
228F:→ finkel:programming我是觉得差满多的呀 就我自己写过的经验 07/31 03:20
229F:推 LssFOREVER:看八卦长知识~~我绝到看到後面就像在看火星文 07/31 03:20
230F:→ kingofsdtw:抱歉..我也是 局外人@@~ ..都问笨问题.. 07/31 03:21
231F:→ kof2200:记得午夜过後好文才会有!! 07/31 03:21
232F:推 costbook:这篇比我们计算机结构期末考还难 (羞愧) 07/31 03:24
233F:推 keepoo:翻成中文我也会看不懂 幸好是用原文 07/31 03:25
234F:推 kof2200:costbook你可以庆幸教授不会深夜爬起来看ptt的喔!! 07/31 03:25
235F:→ costbook:教授目前出国,所以他应该起床了 XD 07/31 03:25
236F:推 tonyselina:後面是到产业了,会考也是前面的部分吧 07/31 03:26
237F:推 s4511981:这种文会爆 可见台湾真的很多人干这行…… 07/31 03:29
238F:推 kof2200:考教授什麽是ddr不知道会不会猜对!? 07/31 03:30
239F:推 maxssn:是麦子大耶..有读过计概或微算机应该看的懂.......名词 XD 07/31 03:31
240F:推 feizizi:东尼又跑来装熟了 XD 07/31 03:32
241F:推 costbook:怪了,我们用的书是Mano那本蓝皮的,怎你们都用白算盘? 07/31 03:32
242F:→ feizizi:请问麦子大大都在哪个版出没啊?? 想多拜读一下他的文章~~ 07/31 03:33
243F:推 kof2200:costbook你哪间!? 07/31 03:34
244F:→ feizizi:或是说请教一下版友 哪个版会有类似这篇文章内容的文章?? 07/31 03:34
245F:推 decadentCat:拍谢挖跨拢谋.......... 07/31 03:34
246F:推 stejiang:他常出现在魔兽版阿 被他电过 哭哭 07/31 03:34
247F:推 tonyselina:奇怪,会喊我装熟,但是我又不认识你,承认是爱猪肉了 07/31 03:35
248F:推 maxssn:魔兽板 XD 07/31 03:35
249F:→ kof2200:魔兽版的英文是!? 07/31 03:35
250F:→ tonyselina:还真是神奇,整天用跳板,但是推文老爱露馅,可怜 XD 07/31 03:35
251F:→ kof2200:哪间大学的计组是用Mano那本蓝皮的啊!? 07/31 03:36
252F:推 choupi:WarCraft 07/31 03:37
253F:推 costbook:喔...我们是"科大"。蓝皮书太简单了吗? 07/31 03:37
254F:→ kof2200:掯~~~好难!!可以给校名吗!?我马上发email申诉!! 07/31 03:38
255F:推 tonyselina:kof是在干嘛? 话说转这文去电虾就超奇怪的 07/31 03:39
256F:→ kof2200:增加知识!!独乐乐不如众乐乐~~ 07/31 03:40
257F:→ kof2200:我每天晚上都熬夜蒐集一些很好的文章!! 07/31 03:42
258F:推 kingofsdtw:爆!! 我只知道 三国版.. WarCraft! 07/31 03:42
259F:推 suzukihiro:转就转了 有差吗 07/31 03:45
260F:推 kof2200:tonyselina你怎麽知道我用跳板!?你是我认识的吗!? 07/31 03:50
261F:推 e04su3:不是很懂 但看起来很专业 大家都推 我就推吧 07/31 03:54
262F:推 kof2200:小弟错了!!我删除了~~~ 07/31 03:55
263F:推 OpenGoodHate:<-stallings 培生 只上一学期 一整个没印像的计组 07/31 03:57
264F:推 vintw:除了OpenCL之外据传微软也在下一版的DirectX订定类似的规范 07/31 03:58
265F:→ OpenGoodHate:intel 推 Larrabee 想要在分散式领域干掉NV 07/31 04:01
分散式指的是平行计算吗? 如果能够的话,希望能在别的板看到一些更细节的东西。
大家提出来的点都满有趣的。 :)
266F:推 vintw:在研讨会上遇过的很多研究者对Larrabee抱有高度的期待 07/31 04:01
267F:→ vintw:倒是ATi到目前为止都没有实际动作,不知道下一步会是什麽 07/31 04:02
上次听 amd/ati 的人演讲,似乎也是要往 opencl 靠过去。但我还没看到什麽具体作为。
268F:推 germ611:快推...不然会被说我看不懂 07/31 04:03
269F:推 OpenGoodHate:MS的好像是叫HLSL吧 用DX11的SHADER改的(上课印像) 07/31 04:06
270F:→ OpenGoodHate:看了一下笔记,讲反了,是HLSL→COMPUTER SHADER 07/31 04:08
271F:推 james732:有看有推!! 07/31 04:11
272F:推 Lindemann:推专业认真文 07/31 04:19
273F:推 seiyaku:这才叫专业! 07/31 04:19
274F:推 Waterpig:不推人家会说我们看不懂~~ 07/31 04:24
275F:推 vkyoung:这篇只要稍具"电"字背景都可以看得懂, 很深入浅出的好文! 07/31 04:25
276F:推 lolikung:推这篇,计组魂XDDDD 07/31 04:31
277F:推 bomberhack:这篇的重点就是现在的硬体设计偏向硬体整合系统的 07/31 04:43
278F:→ bomberhack:分工合作设计方式,藉以提高软体的效能. 07/31 04:44
279F:推 blackkane:我怎麽觉得重点是涝英文= = 单元 管线 南北桥 主记忆体 07/31 04:49
280F:→ blackkane:周期 时脉..不懂为啥一定要打英文弄的文章看来就很难读 07/31 04:51
281F:推 Phater:有看有推 07/31 04:51
282F:推 jeta890119:有些东西讲英文比中文好懂 07/31 04:56
283F:→ jeta890119:就像数位逻辑的:OR AND NOR NAND XOR 翻中文好懂吗? 07/31 04:57
284F:推 upbed: 或 及 反或 反及 互斥反或 07/31 05:08
285F:推 blackkane:我知道阿 单元 周期 记忆体 英文会比较好懂吗= =? 07/31 05:09
286F:推 upbed: I know a Unit cycle memory 07/31 05:10
287F:→ blackkane:instruction之间真的都是independent < 打独立会难懂囧? 07/31 05:11
288F:推 albert7387:推 完全看不懂 07/31 05:11
289F:→ upbed: 指令 独立 07/31 05:11
290F:推 suzukihiro:有时候中文字你会混淆意思 尤其像管线 深度之类的 07/31 05:12
291F:→ upbed:说真的喔~那个管线跟pipeline我觉得没什麽关联= = 07/31 05:13
292F:推 blackkane:我是说非必要性的啦= = 独立和相依那个我看到觉得超虾.. 07/31 05:13
293F:→ upbed:讲「生产线」还比较容易懂…当然楼上提的独立打独立会比较好 07/31 05:13
294F:推 suzukihiro:可能跟个人习惯有关吧...或许被老板要求成这样 07/31 05:14
295F:→ blackkane:管线这名词翻译不是解释意思 反而像是形容一种观念想法 07/31 05:14
296F:→ suzukihiro:自然而然写出来就变这样了 07/31 05:14
297F:→ blackkane:share 就打分享阿= = 弄得半洋半中的 阅读很痛苦 07/31 05:16
298F:→ blackkane:乡民很爱推的 i有thing要跟you say 就很像这种文章.. 07/31 05:17
299F:推 suzukihiro:其实还好...很多老师上课都这样搞 07/31 05:17
300F:→ suzukihiro:早就被苦毒惯了... 07/31 05:18
301F:→ blackkane:我知道很多老师都爱这样 可是不代表自己要这样阿... 07/31 05:18
302F:→ suzukihiro:大概是被影响到了吧 XDD 07/31 05:18
303F:→ blackkane:上课教学表达是一种笔记方式 能快速表达当然是好 07/31 05:19
304F:→ blackkane:但当打一篇文章时就应该要要求用字遣词了阿..= = 07/31 05:19
305F:→ suzukihiro:或许有人喜欢用口语化来打字 这是个人习惯 07/31 05:20
306F:→ blackkane:我生活笑的音是呵呵 阿我不就可以打注音ㄏㄏ 更传神? 07/31 05:21
307F:→ erasermyself:我跑来电虾版了吗 07/31 05:21
308F:→ suzukihiro:我也不能说他不对 这是他的习惯 我没什麽资格要求她改 07/31 05:21
309F:→ suzukihiro:我又不是他老爸老妈老师之类的 07/31 05:21
310F:→ blackkane:也许吧= = 但不管中英 内容是很正确的 pipeline解释不错 07/31 05:22
311F:→ suzukihiro:可以阿 你打ㄏㄏ我也没意见 颗颗 07/31 05:22
312F:→ blackkane:没要他改阿 也没说他错阿 推文不就舒发自己心得用的.. 07/31 05:23
313F:推 suzukihiro:那就对啦 颗颗 07/31 05:24
314F:推 suPerFlyK:(′・ω・‵) 07/31 05:37
315F:推 jeromeshih:推原po分享文 07/31 05:39
316F:推 sandowZ:我竟然看得懂.... = =" 07/31 06:39
317F:推 neofire:这篇好像也没什麽吧....四年多前的pcdiy有相同的东西 07/31 06:48
318F:→ neofire:不过人家杂志的内容颇有水准,不会连制程,单位,都不会打 07/31 06:49
319F:→ neofire:而且这种东西,随便问一个从celeron 300 oc 500的玩家都弄 07/31 06:51
320F:→ neofire:的出类似的心得,那些问题当初p4上市都有杂志刊出这种论点 07/31 06:54
321F:→ neofire:当时是2002年 07/31 06:55
322F:推 jefflaii:这篇超专业的 07/31 07:05
323F:推 PHINEAR:第三段总归一句话,就是hazard的代价 07/31 07:25
324F:推 PHINEAR:指令平行的部份还有superscalar这技术 07/31 07:29
325F:推 roea68roea68:.........太专业了 07/31 07:31
326F:推 ymsgcat:......我看懂了 07/31 07:45
327F:→ gname:惨了... 我刚好都看的懂...我是不是很宅啊...>< 07/31 08:10
328F:推 Darkword1987:超专业 07/31 08:30
329F:推 woohyuk49:推麦大...超威 07/31 08:35
330F:推 bearching:八卦的清流XD 07/31 08:37
331F:推 parkerlived:Intel如果把nvidia吃下来的话....amd真的要哭哭了 07/31 08:37
332F:推 zznkqb:写得非常的清楚,八卦板果然是神出鬼没的地方 :) 07/31 08:38
333F:推 sohate5566:换句话说,Intel当时觉得netburst冲时脉已经不行了 07/31 08:39
334F:→ sohate5566:所以又改回P3一样的微架构继续推新的产品 07/31 08:39
335F:→ sohate5566:到了i7以後就换了另一种叫做QPI的架构了 07/31 08:40
我不太清楚 netburst 是什麽,但 QPI 应该不属於微架构的一部份(吧?)
QPI 全名是 QuickPath Interconnect ,也就是互连的介面,
主要是用来连接处理器,输出入单元跟记忆体。
并没有牵涉到处理器内部的设计,所以和微架构不是那麽相关。
这个 demo 影片满不错的:
http://www.intel.com/technology/quickpath/demo/demo.htm
336F:推 McHamburger:end 07/31 08:41
337F:推 suzukihiro:SOHATE讲的算是精华 XXDD 07/31 08:48
338F:推 cpt:其实CPU市场萎缩是迟早的事情 AMD不另寻活路只会越来越惨 07/31 08:52
339F:→ cpt:Intel早已布局和TSMC合作打ARM 自己的制程也往将来做SoC发展 07/31 08:53
340F:推 wholewing:怎麽办,我都看不懂QQ 07/31 08:54
341F:→ cpt:再往更久的未来看 如果cloud computing开始主流化 整个软硬体 07/31 08:56
342F:→ cpt:市场生态搞不好都会重新洗牌 07/31 08:56
343F:推 morris2:兄台在晶心上班吗? 07/31 09:09
344F:推 Maybetrue:专业 07/31 09:22
345F:推 sohate5566:简单说Intel过一段时间就脚位技术全都换一换继续噱钱 07/31 09:29
346F:→ sohate5566:Intel就靠洗脑跟技术大搬风就可以噱到一堆无知人的钱了 07/31 09:30
347F:推 im5566:资工魂XD 07/31 09:30
348F:→ sohate5566:所以说请板友们继续买AMD不是没有理由的,别让AMD倒下去 07/31 09:30
349F:→ sohate5566:...完了我会不会被Intel告啊囧 07/31 09:34
350F:推 nfsong:感恩 07/31 09:34
351F:推 Mizake:麦大推推 07/31 09:42
352F:推 jimihsu:太专业了, 没八卦.......那 VIA 呢 ? XDDDDD 07/31 09:43
353F:推 willwuwillwu:高手 好厉害 07/31 09:43
※ 编辑: sitos 来自: 140.112.31.132 (07/31 09:54)
354F:推 gmlush:像这种东西翻成中文才会更多人看不懂...专业推 07/31 09:47
355F:推 abucat:M系列是十年左右才有一次的改革....... 07/31 09:49
356F:推 LucasChen:拜读 07/31 09:51
357F:→ syh7211:专业!!所以完全看不懂= = 07/31 09:51
358F:推 asuka627:跨咙某......太专业的关系? 07/31 09:54
359F:推 TurtleBB:推一下,超专业。 07/31 09:57
360F:推 ntcbacc:太专业了,我还请同事帮我翻译 07/31 10:03
361F:推 koibito1103:想问她要不要跟楼下的经济学结拜 攻占台湾理论市场... 07/31 10:05
362F:推 BIGHEADXYZ:因为单就时脉来讲,目前CPU的效能还是远胜於GPU的 07/31 10:14
363F:推 YouCantGetME:喔呵 是麦子 07/31 10:14
364F:推 dragoni:推一下 07/31 10:15
365F:→ BIGHEADXYZ:而且也不是什麽程式都能作平行,或许以後在设计演算法上 07/31 10:15
366F:→ BIGHEADXYZ:都会朝着以平行的角度去思考吧:D 07/31 10:16
这种声音现在很多。对於解同一个问题而最佳化的程式来说,
非平行程式的演算法在单一执行绪可能可以执行得很快,但可能无法平行化。
而平行程式的演算法在单一执行绪时可能较慢,但透过多个执行绪同时执行,
还是可以达到加速的效果。
能够直接被平行化的程式,现在工具很齐全,要平行化相对起来比较容易。
但有很多演算法一开始设计的时候没有考虑到平行化的问题,就变得很难处理。
因此对於解同一个问题而言,为了平行化而演算法整个重新设计的例子也不少。
这是可能是继续榨出效能的唯一方法了。
因为单一处理器的效能可能快要走到尽头了。
367F:推 BIGHEADXYZ:单台电脑有OpenMP和CUDA丛集电脑有MPI,或许未来真的是 07/31 10:21
368F:→ BIGHEADXYZ:平行程式的天下了吧? 07/31 10:21
现在几乎所有的人都在推广这件事,毕竟程式能平行化,
多核心系统才有用,多核心系统有用,大家才会买,整个电脑产业才会继续走下去。
但事情也许不会那麽乐观,如果景气不好,低价低功率系统也会变成主流。
电费现在也是很贵的,一直冲效能未必符合市场的需求。
※ 编辑: sitos 来自: 140.112.31.132 (07/31 10:33)
369F:推 lovetyrano:推 07/31 10:30
370F:→ kondoyu:系统程式被当掉 哭哭 07/31 10:30
371F:推 derayxu:同学注意! 这篇下学期的期中考会考, 请画重点! 07/31 10:37
372F:推 japan428:我小五的时候就看的懂了..... 07/31 10:46
373F:推 stone0504: 07/31 10:50
374F:推 kof2200:考台清交成研究所考生注意!!这篇明年研究考试会考XD 07/31 10:53
375F:→ kof2200:台大去年资工的OS考的好机车!!可以申诉一下吗XD 07/31 10:54
376F:推 Deltaguita:那以後还会有专业绘图卡跟一般显卡的区别吗? 07/31 11:03
其实我到现在还不是很懂专业绘图卡跟一般显卡的差别,我不是做影像处理的。
以之前粗略的了解,至少在 gpgpu 的架构底下,主要也只差在运算单元的多寡而已。
当然,多寡就决定速度,但两者之间似乎没有太明显本质上的差别。
不过这应该要请对这方面了解更深的人来回答比较恰当。
377F:→ Deltaguita:改个函式库就能就差很多~ 以後还是会这样? 07/31 11:04
378F:推 Pumama:管线跟记忆体是必考题 这篇要读熟 07/31 11:12
379F:推 livilivilivi:怎麽办我全部看的懂说~ 07/31 11:17
380F:推 pkgo50:计组计结魂!! 07/31 11:20
381F:推 mgdesigner:这是篇难得的专业文阿!顺便回某些乡民,计算机结构学 07/31 11:27
382F:→ mgdesigner:本来就很深阿.... 07/31 11:28
383F:推 qbaow:快推 不然别人会说我看不懂!! 07/31 11:30
384F:推 OpenGoodHate:专业绘图卡差在稳定度差很多 By:我的图学老师 07/31 11:31
385F:推 gcshin:看不懂…推一下装懂好了 07/31 11:33
386F:推 livilivilivi:秃然想到intel以前推过的VLIW,好像被搞的没消没息~ 07/31 11:34
VLIW (very long instruction word) 之前似乎是 intel + hp 在努力推广。
代表作是 itanium 2 。在商用机器上面应该还是有不错的表现,
但我没有用过实机,身边也没人用过,不知道实际上的效能怎麽样。
当然 intel 自己会说很好,不过用得人似乎没有很多,那代表??
387F:推 eddiewen:专业推! 07/31 11:39
388F:推 abc0:那OpenCL跟Cuda会相容吗? 07/31 11:39
OpenCL 还没有制定完成,但以 wikipedia 上的资料, nvidia 也是发起者之一,
如果 nvidia 愿意的话,应该是有机会可以相容或某种程度的互通。
不过偏软体这方面我就不太熟悉了。
389F:推 OortCloud:其实现在电脑会慢 都是卡在汇流排的频宽不足.... 07/31 11:47
390F:→ OortCloud:还有某个机械性结构的东西.... 07/31 11:48
解决汇流排问题可以另外再写一篇了。其实也是一直都有进步,只是产品化的还不多。
391F:推 coolfishman:看不懂 07/31 11:51
392F:推 imprezasti:计组计结魂!! 07/31 12:02
393F:推 lindet:XD 同学推 不愧是正教授! 07/31 12:03
394F:→ applejone:其实有不少错误 07/31 12:11
哈,相信一定会有的。
395F:推 Pash77:不能说错很大! 只能说谬误蛮多的... 07/31 12:12
396F:→ Pash77:面积影响的是良率,不是成本,而且不是平方关系... 07/31 12:13
397F:→ Pash77:全部看懂但不知道错在哪的,CO/CA两本都要重看了 07/31 12:14
良率会影响成本。当然说和面积呈平方是过於简化,主要是想表达超线性的成长。
不同的制造过程,不同技术,影响的状况也不一样。这请半导体制程专业的人来讲好了。
至少对做 CA 的人来讲,目标就是让面积变低,至於会变便宜多少,
倒是不太会仔细去估。通常会看到面积可以省几 % ,但不太会去估钱会差多少。
398F:推 garytsai:正教授+1 07/31 12:15
399F:推 lindet:...面积影响良率 良率影响成本 好像没错啊 07/31 12:15
400F:→ Pash77:面积跟良率的公式不是那麽简单的关系,成本的计算当然错了! 07/31 12:17
401F:推 IntelC2D:推啊...! 07/31 13:05
402F:推 huckebein12:虽然不是看不懂,但是真的没必要打一堆英文冲专业度 07/31 13:07
403F:→ huckebein12:打英文又不会比打中文快速,何必呢? 07/31 13:08
因为平常在打跟计算机结构相关的东西的时候,已经很少用中文在打了。
而且脑袋里面第一时间浮现出来的也是英文的名词,不是中文的名词。
要转成中文还需要花一点时间去想,才知道对应的词是什麽。
其实这里面写的东西也没多专业,用英文单纯只是贪个方便而已。
看大家觉得这麽痛苦,下一次中英文都标出来好了。
404F:推 showforce:计组魂啦!! 07/31 13:14
405F:推 cityeffect:快推~不然别人以为我们看不懂~ 07/31 13:38
406F:推 winble:推 07/31 13:55
※ 编辑: sitos 来自: 140.112.31.132 (07/31 14:00)
407F:推 fish0612:看不懂耶 囧rz 07/31 14:55
408F:推 alskdj:反正没钱预算不够都用不到 $$$$$$$$$$$$$$$$$$$$$$$$$$$$ 07/31 15:37
409F:推 irix2007:我个人会赌OpenCL, 不想试cuda..不过M$不想加入OpenCL.. 07/31 15:48
410F:推 ss60315:老实说我看不懂.. 07/31 16:22
411F:推 padro:clock rate一直都跟pipeline有关 07/31 16:33
412F:→ padro:在northwood之後 prescott更是深化到40 (没记错的话) 07/31 16:34
413F:→ padro:因为分支预测错误上升 在低时脉反而会在效能上有更大下降 07/31 16:35
414F:→ padro:prescott在超过3.8G的效能可以狂电northwood 07/31 16:36
415F:→ padro:问题却又无法解决clock攀升後造成的问题(本文内有提到) 07/31 16:36
416F:→ padro:更正 prescott pipeline 31 stages 07/31 16:37
417F:推 padro:另外 在Processor部分各家都有争论 但PC上用的GPP使用指令集 07/31 16:43
418F:→ padro:目前是被过去给绑死了 包含设计概念 07/31 16:43
419F:→ padro:Cell使用的PPE+SPE概念其实是一个相对前卫的processor 07/31 16:44
420F:→ padro:几乎是朝向把GPP+GPGPU的概念整合 07/31 16:45
421F:→ mamaka:中英文夹杂 昏了 07/31 17:15
422F:推 CaoPi:推啊! 07/31 17:21
423F:推 bigbigword:一半一上看不懂...囧 07/31 18:43
424F:→ tinlans:我对 CUDA 没兴趣,H.264 的实作残废又跛脚。 07/31 18:43
425F:→ bigbigword: 以上 07/31 18:43
426F:→ tinlans:这种中英夹杂是好的,看过全中文专利真的是会昏倒。 07/31 18:44
427F:推 BlueRacing:一年没碰书我竟然还看的懂 XD 资工魂~~ 07/31 18:52
428F:推 ddx:好文!推一个 07/31 19:23
429F:推 wefun:缩短pipeline,增加 paralism数,目前看来这个策略是正确的 07/31 20:15
430F:推 gmoz:GOOD 07/31 20:26
431F:→ gmoz:资工的看不懂这篇该打屁股XD 07/31 20:28
432F:推 cloudstr:快推 不然别人说我看不懂 07/31 21:39
433F:推 DDR2:今天买了245~ 07/31 22:24
434F:推 spfd:太专业了~看不太懂~不过还是推 08/01 09:44
435F:推 sohate5566: 推 DDR2:今天买了245~ 08/01 10:03
436F:推 philipwen:借转 08/01 11:45
※ philipwen:转录至看板 PDA 08/01 11:46
437F:推 saxer:CELL的问题是tool chain和CUDA相比还是太不友善 08/01 12:01
438F:→ saxer:另外它里面每个SPE里面都有个别的DMU可以作data moving 08/01 12:02
439F:→ saxer:好处当然是弹性较高 但缺点是programmer必须很清楚CELL的架 08/01 12:03
440F:→ saxer:构才能做很好的performance tuning 而CUDA这部分已经帮你做 08/01 12:03
441F:→ saxer:掉了 08/01 12:04
442F:推 stgo:推 08/01 13:20
443F:→ tinlans:根本就是 IBM 的人不会写 library 才会这麽麻烦。 08/01 14:03
444F:推 Yie:太专业了,看不太懂。 08/01 15:52
445F:→ padro:Cell的问题就是parallel programming对一般programmer来说 08/01 17:02
446F:→ padro:都还只是刚起步而已 对称架构的processor都搞不太定了 08/01 17:02
447F:→ padro:还搞出以现在来看都还蛮前卫的multi-core processor XD 08/01 17:03
448F:→ padro:然後当初IBM跟本等於没写library阿 XDD 08/01 17:04
449F:推 padro:如果Cell是专用processor倒也还好 08/01 17:07
450F:→ padro:问题是设计之初这应该是颗泛用的processor才对阿 (爆) 08/01 17:08
451F:推 ericsk:原PO是强者计算机结构博士候选人! 太强了 08/01 21:17
452F:推 azegrant:推 真的很棒 就是看这种文才会长知识 谢谢大大 08/01 22:13
453F:→ saxer:Cell你要用专用processor也可以 他那颗MPU是power pc 算够力 08/02 01:01
454F:→ saxer:SPE和GPU的脚色依样 本来就不是拿来作general processor 08/02 01:02
455F:推 jayhang:太专业了,帮推 08/11 12:09
456F:→ bathape:看不懂 01/09 19:15
457F:推 eageoneal:看得懂给推!!! 非计组应该很难懂XD 04/14 00:36
458F:推 onlytfgsu: OBOV 07/18 10:03
459F:推 chens123: 一个连论文都会抄错字的人,大家还指望 42.75.116.149 07/25 00:51
460F:→ chens123: 棒球场能多好 42.75.116.149 07/25 00:51