主题:【文摘】龙芯意见 -- 【子衿】
那个把译码以后的指令放icache的想法是很好的,这样就把流水线减少了几级,所以后面的计算部分稍微增加几级也可以,分支预测失败并不会对性能有重大影响。但是,x86相较于risc的一大优势,是代码密度高30%左右,所以,在相同大小的cache下,x86的执行性能会高不少。而现代的cpu,其核心面积基本上由cache大小决定。所以,x86综合性能在现代电子技术下并不比risc差。
如果icache存储译码指令,这个优势就不存在了,而且还会需要不少的附加开销。所以P4的12kuop icache大致只相当于4-6KB的icache。由于这个icache还非常占面积,所以dcache也被缩小了。P4的cache指标在当时也是最低的,比别的cpu低了一半还多。这就导致P4综合性能大幅度下降。
如果是现在来做,电子技术可以集成更大的cache,虽然使用NetBurst仍然会降低缓存的指令量,但是现在可实现的cache规模已经基本不会对对性能有重大影响了。这样,主频可以更进一步,综合性能可能有不少提升。
- 相关回复 上下关系8
压缩 2 层
🙂现在cpu两巨头intel/amd有什么标准元件库可用? 1 无星之夜 字618 2010-04-22 19:46:56
🙂x86与RISC 12 发了胖的罗密欧 字1215 2010-04-22 08:47:22
🙂花 1 大溪水 字0 2010-04-23 06:06:57
🙂NetBurst其实是生不逢时
🙂还是指令集的问题 3 发了胖的罗密欧 字745 2010-04-22 18:09:48
🙂不同意你关于内存的陈述 3 类反词典 字960 2010-04-22 22:00:37
🙂一个CPU一个GPU,无法比较 zllwy 字17 2010-04-22 02:12:17
🙂要頂要花 老调重弹 字0 2010-04-20 06:54:49