大型计算机入校园:大学纷纷开始使用AI超级系统
Winona Snapp-Childs和国家基因组分析支持中心主任Sheri Sanders带着学生Christine Campbell和Lyric Cooper参观印第安纳大学的 Jetstream数据中心
正当返校季,多所大学纷纷准备启用全新的AI超级计算机,无论是基础科学,还是文科,各个学科的研究人员和学生对此都已迫不及待。
明尼苏达大学研究计算总监James Wilgenbusch,谈到慧与正在建造的加速超级计算机Agate时表示:“大家现在就想用上它了。”
全球至少有八个新建的学术系统,Agate是其中之一,还有四个位于美国的中心地带,两个位于英国。
预计于本学期结束之前,Agate的运算性能将可达每秒7千万亿次浮点(Petaflops)。它将从社会经济趋势研究,天体研究等各领域,满足所有人的研究需求,James Wilgenbusch表示该系统将设在明尼苏达州超级计算研究所(MSI),通过NVIDIA HDR 200Gb/s InfiniBand网络连接265个NVIDIA A100 Tensor Core GPU。
Agate将为约4500名用户提供服务,这些用户将在1000名主要研究人员的领导下工作。自1月以来,研究人员已经在MSI的现有系统上运行了多达138,612项GPU加速工作。
全速运行:位于奇珀瓦福尔斯的Agate超级计算机正在进行老化测试(图片来源:慧与)
他表示:“用户数在逐年增多,用户量最多的学科是生命科学和文科,比如地质学、历史、政治学、市场营销等。全球各地都有大量非结构化数据,人们也正在探索如何利用这些数据。”
AI超级计算机助力对抗疫情
MSI系统在明尼苏达州卫生部与新冠疫情对抗的过程中也发挥了部分作用 —— 该系统负责根据合约对基因组进行测序,以追踪冠状病毒的变种,而这展示了加速计算的力量。
Wilgenbusch指着Minneapolis一份报纸上的文章表示:“通过像这样的合作,大众能够更加明显地看到,大学在创新和拯救生命方面所起到的作用。”
虚拟GPU加速印第安纳州课堂
在东南方向约600英里处,印第安纳大学(IU)正在建造两台AI超级计算机,它们共装有616个A100 GPU。
由慧与建造的Big Red 200将为印第安纳大学的九个校区提供服务。由戴尔科技建造的Jetstream-2将为康奈尔大学,及夏威夷大学等多家合作机构的工作提供支持。
A100能够将处理器的处理性能分成多个部分,使得Jetstream-2能够承载数百名学生同时参加的课程,每名学生都能使用一部分GPU性能来学习流行的图像分类等AI技能。印第安纳大学的一名研究人员在去年11月提交了一篇论文,描述了对该虚拟GPU功能所进行的基准测试。
印第安纳大学普适技术研究所首席运营官、AI-for-everyone计划负责人Winona Snapp-Childs表示:“现在整个教室的学生可以同时接受培训,这为更多人提供了机会。”
AI无处不在的愿景
超过2500名学生使用印第安纳大学目前的GPU加速系统。去年,该大学创纪录的10亿美元研究合同和拨款分布在178个学院,其中超过40%的工作由这些系统运行。
Snapp-Childs表示:“资助机构意识到机器学习在AI,加速计算等学术领域的重要性有助于推动科学发展。我可以想象,在未来的5到10年内,可能近一半的研究都将用到这些技术,它们将变得无处不在,并成为学术研究中必不可少的技术。”
这项工作的覆盖范围之大令人惊叹。从追踪社交网络上的疫情错误信息到研究水稻的基因组以提高收成,研究人员正在运用AI开展各种工作。
Delta开创无障碍超级计算的先河
隔壁的伊利诺伊大学厄巴纳-尚佩恩分校国家超级计算应用中心(NCSA)正在使用Delta扩展加速计算的应用。Delta是装有超过800个A100 GPU的AI超级计算机。
负责管理Delta的主研究员兼美国国家超级计算应用中心主任William Gropp表示:“我们将帮助计算考古学和数字农业等新兴研究领域使用新的计算方法和硬件,同时提高先进系统的可访问性,使其能够被研究人员广泛使用。”
该系统是美国国家科学基金会推广GPU计算作为通用研究加速工具的一种方式。这项工作还包括一项使残疾人士也可以无障碍使用Delta和未来系统的倡议。
佛罗里达州大力推广AI
往南一千英里,佛罗里达大学的HiPerGator AI系统同样是一个引人注目的加速计算示例。
在盖恩斯维尔太阳报最近的一篇文章中,院长Joe Glover表示该系统将为人们普及AI技能,就像Henry Ford的第一条装配线让美国人买得起汽车一样。佛罗里达大学的目标是增加100名专注于AI教学的教师,使机器学习渗透到所有课程,并提出了到2030年培养3万名AI毕业生的目标。
HiPerGator AI通过HDR 200Gb/s InfiniBand网络连接多达1120个A100 GPU,在最新全球最快超级计算机TOP500榜单上排在第22位。由于采用了NVIDIA DGX SuperPOD参考架构,它在短短几周内就完成了建造。该架构能够以“搭积木”的方式堆叠NVIDIA DGX系统。
AI超级计算机在全球遍地开花
上述五台AI超级计算机仅仅是美国和欧洲正在不断发展的顶尖AI超级计算机中的冰山一角。
- 在加州大学伯克利分校,研究人员刚刚启动了Perlmutter。这部全球第五快的系统装有6144个A100 GPU。
- 剑桥大学也已启动CSD3超级计算机。这台基于戴尔科技EMC PowerEdge的云原生超级计算机目前是英国最快的科研超级计算机,并在全球最节能系统Green500榜单上排名第三。
- 爱丁堡大学正在建造一个拥有448个A100 GPU的系统。该系统将与英国DiRAC研究小组运营的四系统网络连接。
- 瑞典最大的超级计算机BerzeLiUs位于林雪平大学,它将为国家AI计划提供服务,同时被用于与新加坡南洋理工大学开展研究合作。
这些世界各地的高性能系统通过机器学习和加速计算推动科学发展。
*本文转自 NVIDIA英伟达企业解决方案
评论