主题:【文摘】龙芯意见 -- 【子衿】
早就想写一些关于中国芯片个人想法,现在看到机算所的龙芯2让我有了发表一些看法的冲动。
提起机算所,我还是有一些感情。我的父母在机算所工作了30多年,特别是我父在负责某大型机时,费寝忘时工作。我也是在机算所南楼北楼,简易楼,中关村游泳池消磨我的童年和少年的时光。
首先我认为龙芯的开发团队缺少懂得半导体工艺和电路设计的人。光依靠使用 VHDL/Verilog coding 和 CAD tools sythensis then generate layout 的方法是做不出高性能芯片的。使用这方法的人我们叫他们digital designer, 很大一部份digital designer 不知道电容、电感、transistor是怎么工作的。他们完全依靠 VHDL/Verilog coding, CAD tools,以及 standard cell library vendor。这样设计出来的芯片,很大程度上取决于 how good is your CAD tools and standard cell library。当然digital designer 是必不可少的,他们把 mixed-signal designer and analog designer从繁琐的数字设计中解放出来,使得mixed-signal designer and analog designer把精力放在signal integrity, high speed circuit。
我举一个我们自己设计的例子,在2003年我们设计一个2.5Gb/s,136 通道的芯片。Die size is about 18mmX18mm, total device count is about 90Mil。在高速电路我全部custom design 一直到完成layout,直到信号速度降到311Mhz,才使用数字设计。
到chip integration, floorplanning,为了保证高速时钟的信号完整性, 我还是自己layout,以保证170个锁相环不受数字嘈声的影响。如果你的开发团队没有这样的人,就象一个人少了一条腿。
以INTEL 为例,它一直是一个semiconductor/chip company,CPU just happen to be theirmain product。若不是Japanese kick the shit out of them in DRAM busniess in Mid 1980s,Intel 才不会转向CPU呢。Intel 的几个founders全都是搞材料和工艺的。它的电路设计人员数以万计,每人只抠一点小电路,可谓是“又红又专”。
前些日子又有文章说龙芯3要采用 multicore. 我忍不住想说一句“东施笑颦”(我小学语文老师一定会在此出打上红圈圈)。我想 INTEL and AMD 采用 multicore for their CPU, 主要可能是基于两点:
(1) 当时钟达到2.5Ghz+ 的时侯,芯片散热就是大问题(sometimes show-blocker) (2)当时钟达到2.5Ghz+ 的时侯,signal integrity 无论是在芯片内部还是在PCB上都是巨大挑战。(Correct me if I am wrong on those two points)当它们还没有解决这些问题之前,它们可以用multicore tech继续follow Moore's Law。龙芯远还没有take full advantageof technology node they are using。芯片散热更不是他们的问题,为什么龙芯3要采用 multicore,唯一的解释就是他们没有能力take full advantage of technology node they are using。
Portland,OR
不敢说是可靠消息。
工业化的生产的流程和工艺,或给个网址也行
首先龙芯的开发团队就不能和Intel比。正如文章所说,Intel本身首先是个半导体厂,其次才是个芯片设计商,这是Intel决定性的技术优势,而且是Intel这么多年来一步步形成的。龙芯的开发团队,从文中所述来看,还不能算一个完整的芯片设计团队,他们的主要工作集中在数字逻辑设计,而这也是与中国目前的半导体产业的情况相适应的。
芯片产业目前是分成几个产业块,各有所专,分别解决自己领域里面的技术难点,从而降低整个芯片生产的难度和产品周期。总的来说,有两方面:高层的系统设计和底层的电路设计。
在高层,是为了解决大规模集成电路设计的复杂度问题。当数字逻辑上升到百万门级,再去让设计人员从一个个与非门开始设计是费时费力的。解决这个问题是通过使用各种硬件描述语言来设计。这就好比让程序设计人员使用如C一般的高级程序语言,开发这种复杂系统的难度就比要用低级的汇编语言降低了很多。从硬件描述语言到最后的门电路逻辑需要一个翻译过程,就像C语言程序也需要编译连接等形成最后的机器码程序。这样一个翻译过程是通过各种综合软件来实现。这个综合软件对性能的影响很关键,就好比编译程序的重要性一样。所以综合软件也是有专门的公司在做。这些设计是目前大多数芯片设计人员的工作。
在底层的电路设计人员就不太去管系统是什么样的。在他们看来,一切都是晶体管以及由一个个晶体管所构成的一个个与非门电路和其他基本电路(比如电阻,电容,放大器等)。在这一层,更多的是物理问题,而不是软性的逻辑问题。电路的设计和电路的工作频率以及尺寸关系很大。当工作频率在300MHz以下,波长则在1米以上,电路尺寸一般都不会达到1米,所以这时候电路设计就不太需要考虑电磁波的效应,相对比较容易。当工作频率在300MHz以上,电磁波的效应随着波长的减少在电路上就表现的越来越明显。比如2.5GHz的系统,波长在10厘米左右。电磁波在一个周期中有波峰有波谷,电压在一根导线上就在起伏变化,而不是通常的恒定不变了。这时电路设计就转向射频电路设计,设计时要考虑的问题也复杂起来。看起来,似乎把电路尺寸缩小能够大大避免这种问题。然而当电路尺寸缩小后,更多原来不明显的物理效应就显现出来了,尤其是在半导体芯片设计中。很多效应已经超越了人能够计算的能力。在芯片设计中,即便是不考虑由于线宽下降所带来的额外的工艺难度,90纳米的的设计也要比180纳米的设计难很多。当一个晶体管(PN结?不太确定)只有90纳米宽,这个晶体管的物理特性要比180纳米宽的时候有很大区别,对信号完整性的影响也是有相当大的差别的。这时候电路设计的好坏往往还是要靠模型仿真来验证,反反复复直至最优。单元电路的模型也是有专门的公司在做的,也有公开的(在这里,要再次对那位已过世的伯克利大牛致礼)。有了这些模型,电路的仿真和信号完整性分析计算机可以做的相当准确。可惜,很多模型都是商业机密,尤其是芯片中的晶体管。最准确的模型总是半导体厂商自己的,尤其当宽度越来越小的时候。所以说Intel在这里有决定性的技术优势。龙芯想要做这一层的电路设计是先天不足,必须依赖半导体厂的支持才有可能和Intel竞争。
至于说多核单核的问题,这是cpu架构的问题,当然物理上对电路的限制是个决定因素。但是明显可见,龙芯团队的主要任务还是应该去实现先进的架构,而不在于去做底层的电路性能提高,这些应该交给别的团队去做,除非有一天龙芯真的成长为如Intel一般的巨无霸,那就可以通杀了。
据悉,近日,中国首台采用国产高性能通用处理器芯片“龙芯3A”和其他国产器件、设备和技术的万亿次高性能计算机“KD-60”由中国科学技术大学和深圳大学联合研制成功,并于4月17日通过了专家鉴定。这是继2007年底中国科大成功研制基于“龙芯2F”处理器的高性能计算机“KD-50-I” 后,中国高性能计算机国产化的又一次重要突破。
孤子啊孤子,没有自己的名字,哂哂。
代工厂的工艺流程应该从何处得到?
还想知道叠层。
最近才接接触底层和layout....
处理器的公司应该是江苏综艺股份,一直在弄这个东西,但是商用的不是太好,价格能有比较优势么,期待进一步的解读。
百万亿次的曙光7000机群09年2月就用上了。这个的特点是芯片都是自己造的而且水准比较高。以后会有更强的机群出来。
尤其是Intel这样在process和Design两方面都同时达到最顶尖(没有之一)水平的公司....
至于最准确的模型之类的问题...在代工行业,代工厂(也就是掌握底层电路的)总是会把自己最准确的模型提供给客户的,由于自己没有产品所以和客户没有竞争关系,所以不存在给不给最准确的问题(想三星那样三心二意的就难说了).问题在于,一是代工厂本身的技术能力,它的底层电路的性能能否达到intel的水准,模型是否能准确到intel的水准;二是设计公司对此工艺的了解程度的深浅,毕竟不是一个公司,工艺也不是定制的.
就龙芯而言,代工主要伙伴是TSMC,2nd Source在SMIC.T的工艺能力在业界是首屈一指的(当然比Intel应该还差一点点),它也是唯一帮助AMD代工CPU的公司(工艺实力可见一斑).鉴于AMD现在已经剥离制造部门(就是现在的Global Foundry)走上如Qualcom般的纯Design House模式.目前唯一还是纯IDM一统天下的CPU业界也开始松动,可以预期将来未必不会出现只做Design的CPU巨头.
假如龙芯能如同AMD和Qualcom一般有一群对底层电路和制造工艺烂熟于胸的专家,能与他们的代工伙伴紧密合作并给予一些关键技术上的帮助,未必不能与Intel一较长短,就和AMD一样.
但假如还是只有纯设计人员而缺乏工艺制造专家,终究无法在核心竞争力上与Intel达到同一个数量级.
看看IBM是什么时候做的多核,intel什么时候做的。
IBM的基础物理和专利是intel的多少。。。呵呵。
但是单个核心的频率只有750mhz到800mhz,而现在的主流cpu都是2.4G-3G的水平.
中国的cpu设计还是被制造工艺限制,无法提高水平.龙芯也就是个拿来培养团队的东西.
现在一张消费级的显卡,比如amd的5870,一个芯片,核心面积334mm2,而峰值浮点运算能力已经达到2.72TFlpos.是这个80核心集群的2.72倍.5870的售价是3400元人民币.
最先进的工艺和fab都是intel最先部署.
进入65nm以后intel的工艺路线和ibm已经不一样了.
ibm业务范围比较广,intel比较专一.ibm确实有不少高端技术,但是缺乏实际工程经验的反馈,商业部署的步伐是远远被intel抛在后面的.
另外ibm的risc cpu和intel的cisc cpu是不能类比的.