“国之重器”超算中心加速生态聚合

21世纪经济报道记者骆轶琪 深圳报道

作为国之重器的超级计算中心,在此前多年硬件计算方面取得瞩目成绩之后,近些年来加速向软件和生态方面努力。

近日举行的超算赋能高质量发展论坛上,国家超级计算深圳中心主任冯圣中向21世纪经济报道记者分析,超算中心的应用场景,此前大部分算力用于材料设计、生命健康等领域,包括药物筛选等。近些年来,随着AI技术应用普及和深入,AI for science、AI大模型等场景对算力需求日益旺盛。深圳超算近日陆续与市内各类型医院、报业集团等签约,显示出新的计算需求。


【资料图】

不可忽视的是,目前市面上存在多种不同类型的计算架构和相关接口,要实现将超算能力更广泛落地支持各行各业,从软件和生态层面完善各类型支持工具正成为关键举措。各地超算中心早已积极探索。

正如中国科学院院士白春礼在演讲中指出,重大科技基础设施是支撑现代经济社会发展和国家安全必不可少的重要物质技术基础。未来需要更进一步加快以超算为代表的算力基础建设,才能有效激发数据要素的生产活力,加速数字产业化和产业数字化进程。

生态建设加速

进入数字经济时代,超算中心正加速拥抱多类型行业,其应用场景拓维过程中迫切需要完善的软件生态支持。

国家超级计算无锡中心副主任付昊桓告诉21世纪经济报道记者,不同区域超算中心基于前期的积累,大多会侧重于不同的应用领域。国家超算无锡中心目前主要的应用领域可以概括为对宏观和微观尺度两大类型复杂系统的模拟。

宏观层面包括飞机舰船的工业仿真、天气气候系统的模拟,以及天文学研究中宇宙星体相互作用的模拟等;微观层面诸如观测和调控原子、分子的结构变化,为生物制药、新材料研发等提供帮助。

近期呈现的新趋势,是借助超算平台,进一步了解微观层面调整对宏观层面可能带来的影响,走向跨尺度的研究。诸如新材料应用在船体上,其抗腐蚀性等性能机理会有何变化等。

当然还有人工智能,“2016-2017年间,无锡超算已经开始研发面向大规模深度学习应用的基础库和框架研发。”付昊桓补充道。

在应用落地时,生态建设正成为当前超算中心关注的一大议题。在前述论坛的圆桌讨论环节,付昊桓也表示,应多关注相关应用和生态的培养。

举例来说,超算在为客户做工业仿真应用落地时,除去中间最耗费算力的仿真阶段之外,前、后处理也是必要的部分,因此需要完整的软件生态支撑才能吸引更多工业用户。同时,能源、金融等行业也会担心数据安全问题,因此隐私计算的解决方案也需重视。

付昊桓介绍,以美国英伟达公司为例,从2007年左右将GPU引入通用计算领域以来,投入了大量资源建构基础软件、工具软件等体系。随着2012年深度学习快速发展,针对深度学习能力搭建的算法库、框架、工具等都进一步形成更好支撑,吸引科学家和研究者在这一生态上贡献各自才智,才带来了近十年来人工智能技术新一轮的飞速发展和大模型技术的涌现。

“这也是国产超算及人工智能软硬件技术发展进程中需要经历的阶段。硬件层面,国家级超算中心的若干台系统都拿到过全球第一名,但软件仍需要进一步发展和积累,发挥出算力的作用和价值。”他续称,超算要发挥其作为国之重器的价值,要通过应用软件落地到具体的科学或者工程场景中来体现。

他总结道,“当前,软硬件相结合的国产生态建设也更需要关注。此前,国家级超算在几个特定应用领域攀上高峰、获得了国际奖项,今后我们更需要坚持和定力,来提升整体生态的总体水平。这意味着要投入时间、精力、资源来做基础性的支撑工作。”

付昊桓表示,在此前已经完成初步积累之后,对于自动化编程工具已经有了较多经验和思考,可以在前期较为艰苦的软件移植经验基础上,进一步沉淀更好的软件工具支持。

“到2018年左右我们发现,研发人员在此前的十几个千万核并行应用的基础上,慢慢开始自发研发性能分析工具、性能优化工具、代码转化工具、IO检测工具等,在基础工具软件越来越好后,行业领域的用户也更愿意到超算平台中探索实现价值和应用。”他进一步表示。

多路线融合

近些年间,越来越多新技术涌现,也为超算的未来发展带来启示。

2021年11月,付昊桓所在团队获得戈登贝尔(Gordon Bell)奖,这被称为“超算领域的诺贝尔奖”,其原因是用超级计算机实现了接近于当时“量子霸权”的计算能力。

对此,付昊桓对记者表示,“量子霸权”其实是量子计算机在某些特定问题上相比于经典计算机的优越性,实际上量子计算机的发展还处在早期阶段。

“我们当时做这个工作的出发点是认为,不同计算方式可以相互借鉴、相互作用。量子计算机有其基于量子本身特性的优越性,经典计算机同样也有量子计算机所不具备的能力和特点。当经典计算机能力发挥到极致时,我们发现在谷歌悬铃木的随机量子电路采样问题中,相比量子计算机没有太大差距。”他希望这项工作可以搭建一个桥梁,使未来量子计算机和传统经典计算机可以相互协作解决问题。

除了超算中心,近些年来,各地也在积极建设智算中心、城市大脑等不同类型计算平台,并通过算力网络进行连接。

付昊桓分析,超算中心和智算中心的计算和应用形态有所区别,因此会在服务城市的应用过程中起到互补作用。

超算更关注将所有算力集聚起来求解一个或宏观或微观的复杂问题;智算更多关注人工智能相关应用的落地。”他进一步指出,“无锡超算中心目前也在支撑无锡市的智算中心建设。基于算力特性不同,传统数值模型需要单精度、双精度浮点的精细运算;人工智能则可以采用半精度甚至8位整数的计算,其应用大部分是一种分散的形态。个人认为,AI大模型是其唯一一个需要将超算规模的计算资源紧密耦合起来使用的大规模并行场景。”

冯圣中则对记者表示,“传统的超算中心和现在的智算中心,类似于全科医院和专科医院的关系。”

他续称,受经济利益和技术的双重驱动,计算机体系结构存在一个大约十年周期的专用-通用螺旋式发展定律。“比如通用计算发展到一定阶段后,为了让其在某个专用领域表现更好,科学家和厂商会针对性设计专用处理器,瞄准细分专用市场。发展过程中基于经济利益驱动,为了扩大市场,专用又会走向相对通用的发展阶段。这是技术-经济双重驱动的结果,不以个人意志为转移。”他指出,因此传统通用的超算中心和专用的智算中心,各自有侧重的优势领域。

换个角度看,AI对于超算中心或许也将带来新的启发和促进。

付昊桓对记者分析,超算中心也在关注和吸收多种领域计算方式带来的变化,由此可能为超算技术发展打开新方向。“有部分AI领域的专家认为,大模型的能力,主要来自于它对现有文本数据进行很好压缩和编码。而对于复杂的地球系统,包括气候及固体地球等不同圈层,我们都积累了大量观测和模拟数据。在这些领域,AI大模型也可以将数据更好进行编码和组织。这种处理问题的方式,肯定会对超算领域的传统方法带来新变化,我们也已经在尝试探索。”

他进一步表示,“大家现在特别关注AI for science的新型范式,很有意思的一块是实现传统模拟方法和新型数据方法的耦合,由此形成新的互动方式,带来新的科学发现,乃至新的研究方法。

关键词: