西西河

主题:天河1A的一些消息 -- 大龙猫

共:💬6 🌺28 新:
全看分页树展 · 主题
家园 天河1A的一些消息

最近听到一些关于天河一号A的一些信息,拿来与河友分享。

两周前在AGU秋季年会上,在一个计算方法的专题里,有一位在美华人计算机系主任的报告,他用TH-1A算一个大气环流的模型。因为他是在PESTc的基础上写的程序,所以没有用到GPU,只是在CPU上算了。他的结论是,TH-1A称不上好,但也不算坏。印象里有个数据,用几十个CPU跑一个循环,大概10秒内;用上万个CPU跑,要100秒内;性能下降很多。这就是他说天河不算好的原因吧。

在另一个关于GPU计算的专题里,有个目前GPU计算体系的比较。TH-1A的互联技术是私有的,但接口还是PCIe;TH-1A是一个节点带一个GPU。与之相比,TOP500第四日本人的TSUBAME 2.0,互联是InfiniBand,接口是PCIe;令人吃惊的是,日本人一个节点带三个GPU。众所周知,超级计算机里互联、调度技术是最重要的。显然,日本人的方案里,对互联、调度这块的压力比天河更大。

所以,我不看好天河的互联技术,理由如下:

第一,天河的接口还是PCIe,所以天河的互联技术无论怎么神秘,都不可能超过这个限制;

第二,日本人的方案对互联要求更高,但日本人用的是公开的Infiniband技术;所以估计天河的互联技术不会比Infiniband强;

综上,估计天河的互联技术最可能是仿的Infiniband,但技术没吃透,所以性能差些,造成一个节点带一个GPU的局面。

希望我这个估计是错的!

上个月,LANL的人来学校报告,在讲Jaguar和Roadrunner时,也提到了天河一A。先说Jaguar和Roadrunner的对比吧。

几十个CPU时,Jaguar是超Roadrunner的。但几万个CPU(或核吧,记不清了)时,Roadrunner是超Jaguar的。随着CPU数量的增加,Jaguar效率降低很快,而走鹃保持的更好。从这点上来说,我觉得国防大学的天河技术更象克雷的Jaguar,而不如IBM的蓝血基因。

LANL的人讲完了这两个的对比,然后用一种轻松的语气说,现在这两个已经不行了,中国人的天河是最快的。我理解他的语气是这样的:

第一,美国人在建的超级计算机有比天河快的,只是没建完,而被中国人打了个时间差;

第二,这下子,DOE就可以申请更多的经费了:(

总之,从解决有无的角度,天河1A是成功的;但从实际性能对比的角度,天河还有很长的路要走!

尤其是怎么用好GPU的问题,光跑Lapack是不行的。象PESTc不能跑在GPU上,对天河的推广是很大的限制。但天河能等美国人把PESTc移值到GPU上再说吗?

写到这里,意识到我对互联那一块的估计可能有问题。日本人的方案,单个节点向外的的通信流量是比天河大的,因为要传送三块GPU所需的数据;但因为一个节点内的三个GPU可以通过内部总线通信;这样,系统总流量也许比天河小。总之这块很复杂,我这样的外行就不懂了,还是抛砖引玉吧,恳请河友轻拍:)

关键词(Tags): #天河1A
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河