主题:【原创】从超算的发展看中国科技的进步---神威蓝光的问世 -- ★kg90
最近,国内又有一套系统出世---神威蓝光超算系统。这套系统超越了曙光公司的“星云”系统,目前国内排第二(第一是国防科学技术大学的“天河1A”)。
话得从2010 TOP500.org组织公布了全球超级计算机500强,来自国防科学技术大学的天河一号毫无悬念拔得头筹说起---这是中国超级计算机第一次夺冠,在全球范围内引起关注。由此关注下我国超级计算机的发展。进入21世纪,我国超算的发展进入一个井喷期,形成超算研发的三驾马车---国防科学技术大学、曙光公司和江南计算所。三家都推出了有代表性的超算系统---国防科学技术大学的“天河一号”,曙光公司的“星云”系统,江南所的“神威蓝光”。可以说,已经形成了你追我赶的良性竞争态势。
值得关注的是,天河系统和星云系统都是采用CPU+GPU异构混合体系;而神威蓝光则采用的是多核高性能处理器实现了千万亿次的运算速度。这是异构混合体系已经成为主流趋势的另一个方向。另外值得关注的是,天河系统使用了部分国产“飞腾-1000”CPU;神威蓝光采用的是全国产的申威-1600。
下面是这几个系统的详细资料
天河一号A:配备了Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP)、我国自主研发的飞腾FT-1000八核心处理器、NVIDIA Tesla M2050高性能计算卡、224TB内存、专有互连架构、Linux操作系统,总计186368个核心,Linpack最大性能2.566PFlops(每秒千万亿次浮点运算)、峰值性能4.701PFlops,系统效率54.6%。
星云系统:曙光星云是中国第一台实现双精度浮点计算超过千万次的超级计算机,系统由x86架构处理器 GPU计算卡组成。CPU为9280颗Intel Xeon X5650,主频2.66GHz,6核12线程,GPU为4640块NVIDIA费米架构的Tesla C2050。
神威蓝光:全部采用国产高性能CPU搭建。(只有9个机柜,“京”有672个机柜......)
可见我国在超级计算机方面取得了很大的成就。但我们距世界先进水平还有较长的路要走。
国防科学技术大学“飞腾”芯片,仿自SUN公司开源的“UltraSparc T2”芯片。
江南所“申威”来自DEC公司的alpha处理器(risc架构)。(DEC公司被康柏收购,康柏被惠普收购,已经停止了ALPHA处理器的研发。基于RISC的alpha处理器技术上并不落后。)
下面贴上一些2011年国内TOP100超算的资料
美国超算详情一览
练了北冥神功、乾坤大挪移、九阴真经、九阳神功、易筋经....各种神功,拥有屠龙刀、倚天剑的美国,强到无以复加......
------------------------------------------
我国超算行业已经取得长足进步,在TOP500排名里,我国进入前十的计算机已经有两台,排名2和4,超算总数量不断增长,如今已达62台,甩开德国、英国、日本和法国稳居第二名,不过因为“京”的遥遥领先,就性能而言亚军属于日本。
不得不承认的是,目前超算方面最强的是美国,其次是日本。日本此次打榜的是“京”系统,峰值是天河的两倍,功耗更低,采用的是富士的芯片。(“京”多消耗了1.45倍的功耗,获得3.18倍的计算性能,是能效最高的超级计算系统之一。)而天河和蓝光,都是仿制美国公司的芯片。不过,这是一种好的方向,迟早会有自己的指令集出来。可以看出,申威1600采用的制程是比较落后的(65NM),如果采用目前最先进的32NM制程,性能会更优异,能和目前主流的服务器CPU媲美。(ps:蓝光的能效比“京”更胜一筹。)
超算巨擘CRAY已经发布下一代产品规格,使用AMD最新推土机架构16核心处理器和NVIDIA费米架构Telsa计算卡。整套系统将包含18000颗CPU和GPU,最终运算速度将达到70万亿次/秒,完成后将夺回超级计算机王座的位置,并将其他系统远远甩在身后。超算的竞争是一场未完成的比赛,我们还在追赶的路上。
最后,撇除技术的比较,我们可以看出,我国TOP500超算系统越来越多,这说明应用需求的旺盛,也可以看出未来我国科学技术发展已经有了强大的计算支持。我国的科学技术发展将迎来一个黄金时期......
路边社消息:
蓝光是出来打榜的,神威系列有更好的东西,在军方手里。
所谓的自主指令集,实际是由alpha指令集基础上扩展、改进而来。
记得原来有说神威是IA64指令集,也就是兼容安腾。但是好像没有Intel授权,只能偷偷摸摸自己用。
看参数,16核心,很可能是OpenSPARC核心,强化浮点部分。安腾核心比较复杂,集成16核心比较难。就算这样,140.8GFlops的速度也是非常恐怖的,有可能是向量引擎的速度。
sw1600主要是面向超级计算进行的优化,跟完全面向商用的处理器相比,spec成绩大概不会那么好看。
就超级计算的关键技术:互联来说,神威蓝光是非常出色的。神威蓝光的LINPACK效率是:单个处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%,可以看到从单cpu到单机柜1024个cpu互联, 效率只下降了0.13%,单机柜到整机效率下降0.7%,这个说明其互联系统做得相当好。
实际整机的效率的瓶颈在单核的效率,我想主要还是在65nm工艺下单个die里塞进16个核,芯片面积还是有点捉襟见肘,
在最大芯片面积受限的条件下,cache容量肯定受到相当的限制,由于不能放进更多的内存控制器,访存带宽受到的限制也很明显。
PS:欢迎转帖!请注明作者及出处。
- 相关回复 上下关系8
🙂【原创】从超算的发展看中国科技的进步---神威蓝光的问世
🙂重庆将建10亿亿次超级计算机 为当前冠军10倍 ★kg90 字769 2012-02-18 07:18:39
🙂军网有人说, lsgongl 字32 2011-11-16 05:33:32
🙂我觉得这可以看做是江南所的代表作。 ★kg90 字0 2011-11-16 07:56:06
🙂新闻上说, 倚红偎翠 字46 2011-11-07 07:27:46
🙂是。从这一点来说,大家没有分别。天河和京是一样的。 ★kg90 字39 2011-11-07 13:10:04
🙂我知道 2 倚红偎翠 字231 2011-11-08 02:59:24
🙂上面有河友已经说了,这16核有点勉强。主要是工艺不够先进 ★kg90 字0 2011-11-08 06:10:48