天河、曙光、神威是中国超级计算机的骄傲。但一直以来,因天河2号、曙光6000使用美国CPU而遭到的质疑不绝于耳,在美国对中国禁售至强PHI计算卡后,一些人更是“忧心忡忡”的表示中国超算要完。
就在美国对华禁售用于超算的至强PHI后,国防科大先后对外发布勒“火星”和矩阵2000。国防科大自主研发的芯片能否让美国的技术封锁成为笑话,让国外技术封锁后自主技术突破的历史再次上演?
11月10日至11月12日,HPC China 2015大会在无锡召开,大会副主席、中国计算机学会高性能计算专业委员会秘书长张云泉,明确美国禁售CPU不会对中国超算发展造成多大影响,并揭示中国超算发展的现状。
观察者网:能简单介绍下HPC China 2015大会吗?
张云泉:本次大会的参会人数首次突破了1000人,到会代表也更加广泛,主要的研讨主题是超级计算机和大数据的融合问题,特别是如何在体系结构上和软件研发上应对大数据带来的挑战。
观察者网:能具体说说是什么样的挑战吗?
张云泉:大数据作为新的一种应用类型,虽然在过去超算的体系结构设计上也曾经考虑过这个应用类型,但并没有落实,所以超算在做大数据处理的时候会显得效率很低,怎样在体系架构、系统软件和算法软件方面做创新,使超算能够同时支撑科学计算和大数据两种应用,现在是一个很热的话题。
观察者网:科学计算和大数据处理各重视哪方面的性能?
张云泉:科学技算比较重视超算的双精浮点性能;大数据处理则比较重视I/O输出、存储访问的速度、整数计算和逻辑计算性能。
观察者网:网络上有一种声音,认为天河2号使用Intel的CPU,所以中国超算技术就是拿别人的CPU的组装货,没有什么技术含量,您对这个说法怎么看?
张云泉:这个说法是不太科学的。CPU是超算的重要组成部分,但不是超算的全部。超算由大量的计算节点组成,每个计算节点由一些CPU组成,计算节点由高速互联网络连接起来,另外,还有大规模存储系统、系统软件、应用软件和冷却系统等方面,像天河2号,除了计算节点用的CPU是美国Intel公司的,其他部分全部都是国人自己做的。
观察者网:那对网络上非议中国超算的声音,您怎么看?
张云泉:现在发展的形势总体不错,但有些人不满意是正常的。在现在全球分工的时代,很难做到任何事情全部都自己做,最关键的是核心技术必须自己掌握,就像最近下线的C919大飞机,整体设计、气动外形是自己做的。超算也是一样,关键是框架设计必须自己做。当然,全国产虽然很难,但并非做不到。
观察者网:有人认为只要有钱,买更多的CPU就能堆出比天河2号性能高好的超算,您对这个看法怎么看?
张云泉:这个说法有待商榷。因为堆CPU也是一个技术活,体系架构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去,而且还有功耗问题和稳定性问题,哪怕性能上去了,每隔几秒出一次错,这种事情没有一个超算用户能受得了。
观察者网:也就是说CPU其实并非很多人想象的那样是超算全部核心技术?
张云泉:是的,体系架构、互联网络、处理器、存储、系统软件、应用软件、功耗制冷、可靠性等方面都是超算的核心技术,处理器只是其中之一。
观察者网:美国禁售至强PHI会对天河2号的升级造成阻碍吗?
张云泉:基本没有什么影响,中国完全可以自己做。过去天河超算的高速通信网络、大规模存储系统都是自己做的,系统软件和应用软件大多是自己编写或在国外开源软件的基础上深度定制,因此在这方面不存在技术障碍。
观察者网:您对美国禁运怎么看?
张云泉:像现在CPU、高速互联网络美国都是禁运的。其实,中国也不怕禁运,越禁运越坚定我们做自主技术的信心,对做出自主技术越有利。
观察者网:美国禁运后很多原本想捣乱的人也没机会捣乱了?
张云泉:对。这使我们能更好的集中资源和精力做自主技术。
观察者网:在CPU方面中国有替代品么?
张云泉:有。在CPU方面中国也有自己的替代产品,比如国防科大的矩阵2000(GPDSP,因为数字信号处理器有比较高的双精浮点性能,被用来作为超算的加速器——观察者网注)就可以替代Intel的至强PHI计算卡。CPU只是超算的一个重要组成部分,不要把超算等同于CPU的堆积。如果硬要说美国禁售对天河超算造成影响的话,那也只是对天河超算升级的时间造成了延误。
观察者网:用国防科大的DSP做加速器和用英伟达的GPU做加速器以及Intel的众核芯片做加速器有什么区别?
张云泉:在性能方面,这些加速器差别不是很大,到底用那种加速器,主要取决于机器的应用目标是什么,考虑用户的易用性,机器的功耗大小和日后运营的成本,编程的难度和是否能找到数量足够,又会相应技能的程序员,还取决于是否能够采购到相应的加速器以及采购的成本和市场前景。当然现在美国禁运后,坚定了我们用国产DSP替代美国计算卡的决心,这其实也是好事。
观察者网:GPDSP能跑openCL和openMP吗?(这是两种编程语言,openMP是面向多核运行的,openCL是面向众核运行的,两者面向的架构不完全一样的。当然openCL也能支持openMP的架构,但openMP支持不了openCL的众核架构。)
张云泉:GPDSP能跑openCL。
观察者网:一些资料上说扩充一些GPDSP编译指导语句,也能跑openMP?
张云泉:目前还很难做到,即使跑起来也够呛。
观察者网:也就是说,使用国产DSP做加速器后,编程难度会变大?
张云泉:会增加一些,毕竟GPDSP过去没人做过,国内外都没有技术积累,很多方面国内要从零开始积累。
观察者网:目前,中国天河2A正在升级之中,能说说具体升级计划么?
张云泉:天河2A计划用矩阵2000替代美国至强PHI计算卡,因保留了天河2号的主体I/O结构,计算节点处理器依旧使用E5-2692 V2,计算节点增加到18000个,按照一个计算节点需要2个E5和3个加速器来计算,天河2A需要36000片E5和54000片矩阵2000,理论浮点峰值将超过100P。
观察者网:现在超算主要应用在哪些方面?
张云泉:在气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计、工业设计等方面用途广泛。
观察者网:根据网络消息,美国新一代超算四台超算性能都在100P以上,能谈谈美国对超算的应用么?
张云泉:美国超算主要用于核武器模拟,国家信息安全,全球气候变化模拟,新药研制,气象预报,新材料模拟,空气动力学,生物信息学等领域。
观察者网:中国新一代超算能够与美国新一代超算匹敌么?
张云泉:中国新一代超算在性能上是可以与美国超算匹敌的,但在实际应用水平上还有差距。
来源:观察者网