自主芯片+国产系统!天河三号原型机研制完成,中国超算有望重回No.1

简介: 国超级计算机又有新突破!经过两年多的持续关键技术攻关和突破,“天河三号”E级原型机研制部署完成,并于7月22日通过科技部验收。

我国超级计算机又有新突破!

经过两年多的持续关键技术攻关和突破,“天河三号”E级原型机研制部署完成,并于7月22日通过科技部验收。

“天河三号”原型机,全面搭载国产自主芯片,不再使用英特尔处理器。而且相关的操作系统、并行开发等系统也为自主研发。

由此,中国E级计算机将很快进入实质性研发阶段。

按计划,“天河三号”超级计算机有望于2020年研制成功,其运算能力将比“天河一号”提高200倍,存储容量提高100倍。

今年6月,中国丢掉蝉联多次的全球超算冠军宝座,美国超算时隔多年重返榜首。而“天河三号”有望在两年内,夺回这一殊荣。

自主突破

“天河三号”E级原型机,由国防科技大学和国家超级计算天津中心等团队合作研发,并部署在国家超级计算天津中心。

2016年,科技部结合“十三五”发展规划,分两期启动我国E级计算机研制计划。第一期主要为E级计算机关键技术研究,安排了三个E级机原型样机的研制;第二期为研制E级计算机。

其中,“天河三号E级原型机系统”经过两年多的关键技术攻关和突破,成为我国首个完成原型样机系统研制和部署的项目。

公开信息显示,“天河三号”E级原型机实现四大自主创新:

三款自主芯片:“迈创”众核处理器(Matrix-2000+)、互连接口芯片、路由器芯片;

四类计算、存储和服务结点,十余种PCB电路板;

新型的计算处理、高速互连、并行存储、服务处理、监控诊断、基础架构等硬件分系统;

系统操作、并行开发、应用支撑和综合管理等软件分系统。

在技术创新的基础上,“天河三号原型机系统”实现了可适应科学计算和数据处理多应用需求的柔性体系结构,突破了计算、访存、通信三方平衡的高性能计算结点技术。

可支持十万结点规模的高速互连和光电混合高速信号传输技术,高效靶向散热冷却技术,用户透明的高性能计算环境软件支撑等技术。


image

据科技日报报道,“天河”系列超级计算机,在核心关键技术上已实现了整体自主可控。

目前,通用CPU和加速器CPU、互连通信路由芯片和互连接口芯片,均已装配在“天河二号”2期系统中,打破了2015年美国对国防科大和“天河”系超算中心的CPU禁运.

而“天河三号”超级计算机将对这四大芯片进行全面升级。

这还不够,未来“天河三号”E级超级计算机将对已经设计生产的三款计算、互联通信核心芯片再进行全面升级。

同时基于飞腾CPU设计新的多核CPU,实现可支持海量数据存储的层次式存储系统,对适用高性能计算和高效大数据处理的柔性体系结构进一步优化,最终制造出新一代“天河三号”E级超级计算机。

E级超算

所谓E级计算机,是指每秒可进行百亿亿次数学运算的超级计算机,被称为“超级计算机界的下一顶皇冠”。

目前全球最快的超级计算机,峰值运算速度都在每秒十亿亿次级别。

E级计算机有什么用?可以参考国家超级计算天津中心相关负责人的下面这段公开表述:

今后将依托“天河三号”超级计算机,构建超级计算与云计算和大数据深度融合的高性能计算服务平台,在长效高分辨率气候气象预报、大规模航空航天数值风洞、地震地质研究和油气能源勘探、生命科学研究等超大规模计算与模拟,以及涉及国计民生、信息安全的政务数据、医疗卫生、基因健康、智慧城市、交通、地理、海洋等大数据分析处理领域,发挥强大支撑和平台作用,有效推动新一代人工智能发展规划等实施和网络强国建设。

前面我们提到,中国的E级超算原型样机有三台。

除了天河,还有神威、曙光两家。

神威E级原型机由江南计算技术研究所承研,此前已经通过“预验收”。据《济南时报》7月20日报道,神威E级原型机已经抵达济南,开始在国家超级计算济南中心开始组装调试。

预计在7月26日前后将全部安装调试完毕,进入试运行状态。

image

神威E级原型机,也是我国完全自主研发的E级计算机原型机,具有完全自主知识产权。

“我们花了6000万,构建了神威E级原型机,它的运行速度是3-4个P(1P=1千万亿次)。”国家超算济南中心副主任潘景山透露,“E级计算机+E级存储,总投入在40亿左右。”

这么大的投入,为尽量避免失败,所以才有3台原型机进行验证。

现在看起来,天河和神威的速度比较接近,这两台E级超算的原型机,在进度上相差无几,基本处于你追我赶的节奏。

至于曙光的E级原型机,目前公开信息较少。

去年7月,中科曙光宣布由其牵头的E级高性能计算机原型系统项目正式发布。

目前没有看到有更多的进展披露,有分析人士猜测,曙光E级原型机,采用的方案可能是“AMD CPU国产化版本+GPU国产化版本”。

超算竞赛

今年6月25日,新一期超级计算机TOP500榜单发布。

时隔五年,美国超级计算机Summit(顶点)终于超越中国超算“神威·太湖之光”,重回排行榜第一。

Summit由IBM公司负责制造,搭载了27648块英伟达Volta GV100,这些GPU提供了超过95%的计算力;此外还有103752颗IBM Power9处理器。

这台超级计算机占地面积相当于2个网球场大小,重量相当于一架商业喷气机。

美国为了研发这台超算,也是经过多年谋划。为了争夺第一,Summit的发布时间还提前了半年。

image

此次榜单发布之前,中国的“天河二号”和“神威·太湖之光”两台超算,已经接力连续五年稳居超算TOP500冠军宝座。

2015年,“天河二号”在系统升级方面遇到了麻烦:美国商务部针对中国,实行了英特尔“至强”(XEON)芯片的禁运政策。

对于突然实行至强芯片禁运的原因,美国方面给出的解释是这4家中国超算中心从事“违反”美国国家安全或外交政策利益的活动。

而这件事,也促成了国产芯片的发展。中国很快研发出了自主众核加速器。

其实,2002年之前TOP500榜单没有任何中国超算的身影。但此后的十五年里,中国超算突飞猛进,从一穷二白一跃成为世界第一。

目前TOP500中,中国超算总量还是世界第一。

但近期想撼动Summit的冠军位置,是一个几乎不可能的事情。如果一切顺利,2020年前后,“天河三号”等新一代超算,应该会帮助中国超算重新夺冠。

期待。

原文发布时间为:2018-07-27
本文来自云栖社区合作伙伴“量子位”,了解相关信息可以关注“量子位”。

相关文章
|
搜索推荐 JavaScript 前端开发
77 网站点击流数据分析案例(原理及意义)
77 网站点击流数据分析案例(原理及意义)
1054 0
|
编译器 API 定位技术
API和SDK的区别
API 和 SDK 的区别在于:API 是一组定义了软件组件之间交互规范的接口,用于实现不同软件组件之间的通信;而 SDK 是一个全面的工具集合,包含 API、编译器、调试器、文档等,用于特定平台的应用程序开发。SDK 范围更广,内容更丰富,更具体和具象化,适合复杂的开发需求;API 则更加抽象,侧重于功能的定义和调用方式。
|
数据采集 存储 数据处理
数据治理:如何制定数据标准与规范
在当今这个数据驱动的时代,数据已成为企业最宝贵的资产之一。然而,随着数据量的爆炸性增长和数据来源的多样化,如何有效地管理和利用这些数据成为了企业面临的重大挑战。数据治理作为确保数据质量、安全性、合规性和可访问性的关键过程,其核心在于制定并执行一套科学、合理的数据标准与规范。本文将探讨如何制定数据标准与规范,以推动企业的数据治理实践。
2077 3
|
10月前
|
SQL 数据可视化 atlas
低空经济新基建!DataV Atlas 如何用大模型玩转空间数据?
阿里云DataV Atlas推出搭载通义千问最新2.5 Max大模型「时空SQL智能小助手」,通过自然语言生成专业SQL,简化空间数据分析流程,助力智慧农田、城市低空交通及应急调度等领域,推动精准决策和智能化管理。零门槛体验空间智能分析革命,开启“会思考的天空网络”新时代。
726 5
低空经济新基建!DataV Atlas 如何用大模型玩转空间数据?
|
10月前
|
安全 网络安全 数据中心
服务器托管适用什么场景?
在数字化时代,服务器托管对企业运营至关重要。本文解析了五种常见托管方式:共享托管经济实惠,适合小型网站;VPS灵活可控,适合中小型企业;专用服务器性能卓越,适合大型应用;云托管灵活扩展,适应现代需求;托管式服务外包管理,省心省力。选择时需综合考虑预算、技术能力及性能要求,找到最佳解决方案。
421 0
|
10月前
|
安全 图形学
Unity射线检测的“坑”
在 Unity 中,射线检测是常用功能,但也存在一些常见问题。首先是层(Layer)设置问题,如射线忽略某些层或误检测到不期望的层,需正确设置 LayerMask。其次是碰撞体相关问题,包括碰撞体未启用或类型不匹配,确保碰撞体启用并合理设置属性。再者是射线起始点和方向问题,错误的位置或方向计算会导致检测失败,需准确设置起始点和方向。此外,频繁进行射线检测或检测范围过大会影响性能,应减少检测次数并合理设置范围。最后,在多线程中进行射线检测可能导致错误,应避免在非主线程中直接调用射线检测。
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗诊断中的应用:精准医疗的加速发展
【9月更文挑战第16天】随着人工智能(AI)技术的不断进步,医疗领域正经历前所未有的变革。本文探讨了AI在医学影像分析、病历数据分析和病症诊断预测等方面的应用,展示了其在提高诊断准确性、推动个性化治疗和促进医疗资源均衡分布方面的巨大潜力。AI正加速精准医疗的发展,有望在未来实现更智能、个性化的医疗服务,全面提升医疗质量和效率。
602 12
|
存储 关系型数据库 MySQL
【面试】Mysql主键索引普通索引索引和唯一索引的区别是什么?
【面试】Mysql主键索引普通索引索引和唯一索引的区别是什么?
1625 0
【面试】Mysql主键索引普通索引索引和唯一索引的区别是什么?
|
机器学习/深度学习 算法 网络架构
基于深度学习的图像识别优化策略
【2月更文挑战第21天】 随着人工智能技术的飞速发展,深度学习在图像识别领域取得了突破性进展。然而,在实际应用中,模型的识别效率和准确性常常受限于数据量、计算资源和算法设计。本文旨在探讨针对现有深度学习模型的图像识别优化策略,通过改进训练过程、网络结构与后处理技术,提高模型性能并减少计算资源的消耗。
|
存储 Linux
linux /www/server/cron内log文件占用空间过大,/www/server/cron是什么内容,/www/server/cron是否可以删除
linux /www/server/cron内log文件占用空间过大,/www/server/cron是什么内容,/www/server/cron是否可以删除
395 1