知乎日报

每日提供高质量新闻资讯

头图

「天河二号」成为全世界最快的超级电脑,好像连自豪的价值都不大

NNSANews / CC BY-ND

“天河二号”成为最快超级电脑,真的彰显竞争力吗?

冯东,Adobe 程序员
说一些技术之外的政治背景。若干年前,美国国会有一个一年一度可以影响(虽然程度不深,但毕竟可以)中国政策的举动 —— 最惠国待遇审查。而后,美国国会通过了授予中国永久最惠国待遇的决议。此后国内风气的发展,见仁见智吧,不说全受这个影响,也至少有 10% 吧。而游说永久最惠国待遇的大集团之一,就是 Intel 。

再说银河 II 型,这个东西搞的时候目标就很明确 —— 根本没法用!就是告诉美国国会:我们也造的出来,赶紧卖给我们 IBM 巨型机吧!

所以,美国商人的逐利行为,不仅乐于承担中国的巨型机建设,还乐于向国内说明这是中国人自己的功劳。

=== 以下是原来的答案(得 10 票)====

天河二号显示的是我们国家在某些方面出于某种目的发挥出的集中资源的能力。它并不能彰显不可缺少的竞争力。芯片用的是 Intel 产品。软件方面如果没有意外,通常也外包给 Intel 不少。可以说在这些方面美国已经不怎么「封锁」中国。决定因素不过是有没有消耗这些计算能力的市场。至于这些计算能力是政绩工程还是消耗在某些验证工程方面就不得而知了。当然,如果用来计算材料分子仿真或者天气预报,那自然是极好的。

@话明泽 的答案,看得振奋人心,我当年也激动不已。不过业内对这篇文章的水分早就有澄清。芯片技术基本上是 18 个月集成度翻番的水平。在有大量公开设计的情况下,落后一到两年也就跟工业上落后二十年差不多。龙芯基本上就是 MIPS clone。
知乎用户,发明家~~~好奇的眼
前两天刚回答了一个问题理论上一个超级计算机的 CPU 数量有限制吗?结论修改几个字仍然适用——中国的超级计算机同中国的经济一样大而不强,效率低下,商用来讲是不划算的。一个超级计算机的计算能力只受钱和供电能力约束——但是这种效率低下简单粗暴的做法,同中国体育的金牌,同中国的经济的数字一样,可以作为宣传的手段,而缺乏深远的影响力和商用价值。

按照前几年天河1,1A的发展步伐来看,平均效率估计仍然在60%左右,单位能耗计算能力估计会维持在200~300Mflops/W——立此存照,希望天河2能让我眼前一亮——更新TOP500的网站已经有结果了,平均效率62%,而单位能耗计算能力则明显提高到到1901.4Mflops/W,后者进步还是相当明显的,同二三名的差距不大了。性能保持领先的同时,单位能耗计算能力进步明显(虽然效率仍然不佳),这进步再加上未来充分商用可以作为竞争力的象征。

全世界超级计算机有个比较公允的排名TOP500Home | TOP500 Supercomputer Sites,每年更新两次,排名的依据就是跑HPL(Highly Parallel Linpack)HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers,该算法有下面特点
  • 完全并行:在每个CPU使用相同内存使用情况下并行效率是可以不随CPU数目变化的;
  • 足够通用:通过LU分解来解线性方程组,基本上所有超级计算机上跑的问题都离不开;
  • 完全开源: 允许各家超级计算机跑的时候根据自家架构选择最佳问题规模和优化策略;
按说这是非常公平的比较了吧?我下载了排名(November 2012)做了一下分析,刨去那些样本数太少的(小于10),按国家分类。你可以看到象媒体宣传的那样,我们的超级计算机总数72全球第二,特别是天河1A也进入世界第二。
可是真实的情况呢?业内的人士更多看下面这张图的数据。其中柱状图代表一个国家超级计算机效率(即HPL最佳成绩 / 理论所有CPU性能总和)的平均值,折线代表这些计算机的单位能耗计算能力。可以看到中国的计算机在这两个方面还是有相当差距的,是所有造了较多超级计算机的国家中最落后的——你不能和刚起步早了几个小型超级计算机的国家比,是吧?

——回到问题本身,当大家都用一样的Intel / AMD / IBM处理器搭超级计算机的时候,硬件体系架构特别是CPU之间/CPU和内存之间的通路,以及节点容错能力,软件方面则是操作系统的任务调度策略和编译器的优化才是一个超级计算机最核心的技术。这些技术的先进程度决定了一个超级计算机能搭多大才划算
知乎用户,HPC新手
竞争力有还是有,但不高。我国目前只能算超算大国,不能算强国。

现在超算的国产化程度太低,用的全部是美国人的芯片,Tianhe-1A用的是至强和Tesla,现在Tianhe-2用的是Intel的至强+Phi组合。虽然网络用的TH-Express-2应该是自研的,但关键还是芯片啊。目前的国产芯片,比如申威系列或者NUDT自己的基于SparcV9的飞腾,水平还比较次,人才储备也很欠。芯片产业不是简单的高科技产业,涉及到architecture设计,工艺水平和持续创新等方方面面的能力,近年来国内在这方面的研究没有什么起色,在可见的未来,国产芯片应该依然难以满足冲击超算榜单的需求。

除此以外,Tianhe-2在energy efficiency上并没有超过TItan(老的Top 1),性能上虽比Titan快了2倍左右,但同时耗电也比Titan多了一倍多,说明Tianhe在energy efficiency上并没有重大突破,而energy恰恰是超算领域的重点研究方向之一。实际上,不掌握独立的先进芯片研发能力,在energy上也是没有多少油水可捞的。

从市场上看,就我了解到的信息,国内超算没有用满,常规的天气预报和科学计算的利用加起来还比较有限,济南的国产神威蓝光据说还很闲。看新闻说Tianhe-2部署在广州,可能利用率会高一些。