我国披露新一代E级超算原型机 核心器件全部国产化


探访中国超算“下一顶皇冠”:核心器件全部国产

随着日本8月底宣布下一代超算将在2021年问世,中国、美国、日本和欧洲在超算领域的竞争日趋白热化,各方角逐的新战场转移到运算速度达每秒百亿亿次的E级超算。为争夺“超算界的下一顶皇冠”,中国的E级超算研制计划已全面展开。近日,《环球时报》记者独家探访部署有“神威”E级超算原型机的国家超算济南中心,亲眼目睹下一代“国之重器”。

(资料图)

(资料图)

走近“神威”E级原型机

噪音与低温,这是《环球时报》记者走进国家超算济南中心机房的第一感受。这里部署着中国首台全部采用国产处理器和系统软件构建的千万亿次计算机——“神威·蓝光”。一个月前,“神威·蓝光”迎来一个新邻居——“神威”E级超算原型机。

虽然E级超算被誉为“超算领域的下一顶皇冠”,但其原型机却“貌不惊人”。“神威”E级超算原型机目前只是一台一人多高的纯黑色机柜,上面印有金色的“神威E级原型系统”字样。打开原型机的机柜门,里面整齐分布着32个运算超节点,每个超节点又由8个申威众核处理器构成。


作为原型机,虽然它的体积不大,但相比由9个机柜组成的“老前辈”“神威·蓝光”,“神威”E级超算原型机的浮点运算速度达每秒3000万亿次,是“神威·蓝光”的3倍,相当于我国最强超算“神威·太湖之光”运行速度的1/30。

据国家超算济南中心主任张云泉介绍,“神威”E级超算原型机实现了完全自主可控——处理器、网络交换芯片、消息处理芯片等核心器件全部实现国产化。运算系统全部采用具有完全自主知识产权的申威众核处理器;高速互连网络系统全部采用完全自主知识产权的申威网络芯片构建;存储和管理系统采用申威多核处理器构建,实现了对该领域产品的国产化替代。

中国E级超算的三条路径

早在2016年前后,中国已经启动E级超算的研发计划,同时开始3种技术路径的探索:国家超算天津中心同国防科技大学联合研制的“天河三号”E级超算原型机已于7月22日在天津完成部署,国家并行计算机工程技术研究中心联合国家超算济南中心研发的“神威”E级超算原型机于8月5日在济南正式启用。此外,中科曙光也在进行E级超算的研制,但暂时还未披露该项目的进展。

(资料图)

(资料图)

国家超算济南中心副主任潘景山向《环球时报》记者介绍称,2016年至2018年是中国E级超算规划中的第一步,即进行原型机的研发。这一阶段完成后,三家的E级超算将进行PK,通过“赛马机制”确定其中两家并制造出两台真正的E级超算。“根据计划,拥有每秒百亿亿次运算速度的‘神威’E级超算将在2020年正式发布。”

虽然都是走众核路线,但张云泉告诉《环球时报》记者,三家的研发路径却不尽相同。根据此前披露的消息,中科曙光的E级超算原型机采用了自主X86架构处理器和加速器的异构众核体系架构。有分析认为,虽然X86处理器的技术相对成熟,但要将其完美移植到中国的E级超算上,达到较高的性能,依然存在不小的难度。

相比中科曙光,“天河三号”E级超算的原型机采用了“多模融合加速架构”,即同时使用国产飞腾FT2000+处理器和迈创Matrix 2000+加速器。据张云泉介绍,“天河三号”的架构中既有专门的飞腾芯片分区,也有迈众芯片分区,二者既可以单独运行,也可以合力运行。

与“天河三号”原型机处理器+加速器的松散耦合架构相反,“神威”E级超算的原型机采用了紧耦合的“同构众核”架构,在国产的申威26010+处理器中采用四个主核带256个从核的架构。张云泉对《环球时报》记者表示,“神威”的集成度更高,功耗更低,但挑战在于并行编程的难度会提升。“不过根据国际业界预测,未来最合适E级超算的架构应该就是‘胖核’+‘瘦核’。”

中美日欧,都在抢第一

在美国超算“顶点”于今年6月超过“神威·太湖之光”、重夺全球超算第一后,中美之间的超算之争更加趋于白热化,对于下一代E级超算,两国都展示出“势在必得”的姿态。

据美国媒体披露,美国第一台E级超算代号为“A21”,未来计划部署在美国阿贡国家实验室,于2021年投入使用。不久前,美国又宣布2个新的E级超算计划,其中一台将采用与A21不同的架构,部署在橡树岭国家实验室;计划部署于劳伦斯·利弗莫尔国家实验室的E级超算则可能采用一种全新架构。

日本的E级超算研制则基于目前的超级计算机“京”。2016年,富士通和日本理化学研究所宣布为日本开发首台E级超算——“后京”,并计划在2020年部署。但不久后,该项目负责人石川裕博士承认,“后京”的部署可能会延迟。

相较中美日的E级超算研制已经给出明确的时间表,欧洲的E级超算却迟迟没有眉目。张云泉向《环球时报》记者介绍称,由于欧洲超算此前一直采用美方技术,缺少自主核心技术,因此目前虽然有了E级超算计划,但没有看到实质性进展。

“目前来看,中国E级超算计划于2020年完成部署,应当是走在了世界的最前列”,张云泉对《环球时报》记者表示,但可以预期的是,在未来十年,中美在超算领域交替领先的格局不会出现根本性改变。

尽管在超级计算机研发本身,中国毫无疑问处于第一梯队,但潘景山对《环球时报》记者表示,从超算的整体生态来看,中国依然与美国存在差距,业界也在共同努力,希望尽快打造属于我国的超算应用生态。

未来应用要“顶天立地”

超级计算机可谓是“国之重器”,即使抛开数额巨大的研发费用不提,每台超算每年的用电都需要花费上亿元,这让不少民众都提出一个疑问:普通人如何从下一代E级超算中受益?

“对于E级超算的应用,我们的思路是‘顶天立地’”,张云泉对《环球时报》记者解释道,一方面,超算需要服务国家战略,为科学研究提供计算能力。以计划部署在山东的“神威”E级超算为例,它将为国家海洋强国战略构建“深蓝大脑”,支撑海洋和气候预测、海洋药物智能筛选、海底战略性资源智能勘探、海洋生态系统演变预测、海洋大数据智能分析等应用。

另一方面,“神威”E级超算还将立足济南,服务全国,解决健康医疗、先进制造、航空航天、气候气象、生物信息、新能源新材料等一批国家科学与工程计算领域的重大课题,为国家经济建设提供国际领先的计算平台,为中国制造业赋能。

据张云泉透露,在“神威”E级超算原型机正式启用的近1个月中,济南超算中心已经将“神威·太湖之光”的20多个应用顺利移植过来,并进行了一系列测试。

张云泉还向《环球时报》记者介绍,“神威”E级原型计算机也紧跟行业热点,首次在国产超级计算机上构建了人工智能软件生态链,基于神威深度学习库和框架,开展了对弈系统、医疗影像识别、机器翻译多个大规模人工智能应用,其中机器翻译应用的数据规模、并行规模和训练速度世界领先。
https://military.china.com/jsbg/11177786/20180905/33798633_all.html#page_2
這東西不管最後有沒有拿到第一,最重要的是建立了自己的人才和不受制於人的產業鏈...
絕大部分人用的個人電腦的運算能力,這幾年都沒什麼提升...
電腦又回到初期大型電腦運算的時代....
中國自製的晶片?如果以中國16nm ~28nm的製程能力能搞得出來,算可以了其實有點懷疑是麒麟晶片組成
lutin111 wrote:
這東西不管最後有沒有...(恕刪)

stever2018 wrote:
中國自製的晶片?如果...(恕刪)

用手機晶片做超算,你要是做的出來,
真該搬一座諾貝爾獎給你!

jfkcity wrote:
用手機晶片做超算,...(恕刪)


哈~所以連麒麟晶片都要台積電代工居然誇口國產化,
那真該叫諾貝爾出來頒獎了。



死的都給你說成活的了..............
麒麟也是好幾組大大小小arm規格的套件所組成,不見得辦不到,把數十組arm cpu,神精網路,人工ai晶片記憶體等作成刀鋒工作站型態的片式cpu主機板,數量夠多超級電腦當然組得起來,但重點是製程,中國的製程沒有能力用國產製程來搞出超級電腦
jfkcity wrote:
用手機晶片做超算,你...(恕刪)

stever2018 wrote:
麒麟也是好幾組大大...(恕刪)




哥笑了

The Shenwei SW20610 has 260 of these 1.45Ghz CPUs, which are all completely designed and made in China.






steven5201314 wrote:
哈~所以連麒麟晶片...(恕刪)












哥又笑了

ockheed Martin GD-53機載雷達
Rockwell-Collins AN/ARN-153,ARN-118戰術導航儀
Litton 任務計算機
United Technologies 整合大氣數據計算機
Lear Astronics 飛控計算機
BF Goodrich 燃油量測指示控制系統
SCI systems 匯流排介面單元
Allied Signal 整合動力控制單元
Menasco 起落架
Goodyear 飛機輪胎
Martin-Baker 彈射座椅
Garrett TFE1042-70渦扇發動機
Honeywell 座艙顯示系統
Honeywell H423慣性導航系統
Litton APX-101敵我識別器
Litton AN/ALR-85(V)I雷達告警器
Westinghouse 交流發電機

台灣IDF所有關鍵零部件和技術都是國外提供的技術

台灣人居然還說(台灣自製)了IDF






在ISC 2015发布会上,国防科大公布天河2A的升级方案,将采用国防科大自主研发的矩阵2000(GPDSP)替代至强PHI计算卡。矩阵2000采用40nm制程,拥有16核,主频1G,双精浮点2.4TFlops,功耗为200W。
新年伊始,从科技部公开的文章中透露出好消息——由上海高性能集成电路设计中心设计的国产众核芯片已达到世界先进水平(美国情报部门对该芯片非常感兴趣,因此笔者将其称为国产众核芯片)。该众核芯片采用28nm制程,峰值双精度浮点运算速度超过每秒3万亿次(3TFlops),完全追平了Intel第二代Xeon Phi(也是Intel最好的众核芯片)——第二代至强PHI计算卡产品代号“Knights Landing”,采用了14nm工艺,双精度浮点性能超过3TFlops,功耗250-300W。
————————
上面是天河二號用的製程。。。
再高速的晶片,

再快的架構,

都仍然有上限。

原因就在源頭的電子震盪 pulse.

科學界從硬體架構出發的設計,

仍然侷限在橫向之間的鏈結結構。

真正要能突破,

還是必須依靠 軟體的平行運算

方能充份的運用到結構中所有的晶片,

同時去求算以達到目標

否則即使整體算的再快

用序列式的計算 sequential方式,

仍然有上限

可惜至今沒看到幾個能充份發揮硬體效能的

平行運算開發出來,

尤其是決策支援。
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!