2023数据密集型超算发展白皮书

2023数据密集型超算发展白皮书插图

数据是对客观世界状态变化的数字化记录,在数字经济和数字中国的大战略下,数据已成为国家基础性战略资源和关键生产要素,是数字化、网络化、智能化的基础。今年发布的《数字中国建设整体布局规划》进一步强调夯实数字基础设施和数据资源体系“两大基础”。

众所周知,高性能计算是国家综合国力和信息化建设能力的一个重要体现,被誉为“国之重器”。数据密集型超算,是高性能计算与人工智能、大数据等新一代信息技术融合后围绕数据价值,而产生的一个重要新增类型,是在高性能计算领域的一次有益的创新探索,在一定程度上代表了高性能计算的未来发展趋势。我们很欣喜地看到,在过去两年中数据密集型超算在产业各界的多方合作下持续创新,相继在商业应用、标准规范等取得了显著的进展。如文中所述,数据密集型超算在国家超算中心、高校等场景、基因测序、Al大模型等行业应用中产生了很多优秀实践。

与此同时,我们也看到中国高性能计算所面临的挑战和机遇:应用层面,随着数据爆炸,高性能计算从重计算模型,衍生到重IO,大带宽包括混合负载的数据模型;算力层面,通过Al赋能,科学研究正迈向科学智能新阶段,推动Al异构加速;连接层面,随着超算互联作为国家战略,需要实现更高效的网络互联和跨域全局管理。另外,在新的复杂国际安全形势和低碳化全球趋势下,超算安全、绿色节能、自主创新也成为高性能计算业内人士关注的问题。白皮书结合高性能计算在数据密集型场景的发展趋势给出了分析和建议,值得深思。

面向未来,以ChatGPT为代表的Al大模型兴起,数以千亿的参数投入训练,产生对算力和数据的双重需求。HPC与Al逐步走向融合,将成为数据密集型超算的典型应用场景。数据的准备至关重要,数据的质量和规模决定Al的精度。为了更好应对诸如新应用带来的生态复杂性变化、新业务催生的混合业务负载压力、新数据与算力协同带来的数据跨地域访问等挑战,白皮书中创新性地提出新型数据密集型超算5A架构,以应用为中心,较好地支撑HPDA(HPC+大数据+Al)多系统融合业务发展。

长风破浪会有时,直挂云帆济沧海!HPDA正在加速提升科研创新及生产效率,在新的趋势和发展机遇下,期待产业各方深化合作和持续创新,数据密集型超算在推动科研和数字经济发展上发挥更大作用,扬帆远航!

资源下载地址

该资源需登录后下载

去登录
温馨提示:本资源来源于互联网,仅供参考学习使用。若该资源侵犯了您的权益,请 联系我们 处理。
2023数据密集型超算发展白皮书