AI超算爆发!IBM存储系统容量狂飙3倍达47PB。

IBM近日对其Storage Scale System 6000进行了显著扩展,通过引入配备122TB QLC闪存驱动器的新型全闪存扩展柜,使系统在单机架内支持的存储容量提升至惊人的47PB。此次升级标志着系统容量相较此前限制实现了三倍增长,旨在满足处理海量数据操作环境的需求。
该系统主要面向涉及超级计算任务、大型人工智能(AI)工作流程以及云服务交付的组织机构,为它们提供高性能、高密度的存储解决方案。新媒网跨境了解到,这一举措是IBM为应对当前数据爆炸式增长和计算密集型应用挑战的重要一步。
新一代硬件专为承载更繁重的数据吞吐任务而设计。IBM方面表示,新的设计能够有效支持那些高度依赖稳定吞吐量和高可用性的工作负载。此外,更大的平台能够为维护大型集群的操作人员简化扩展过程,降低运维复杂性。
全闪存扩展柜的加入,为系统带来了对更大缓存的支持,从而在集群内部多个层面实现了多租户能力。IBM指出,通过这一优化,操作人员能够在不造成文件系统瓶颈的情况下,同时运行多个数据密集型工作负载。
在硬件配置上,每个2U单元的扩展柜可以容纳多达四颗英伟达(Nvidia)BlueField-3数据处理器(DPU)和二十六块双端口QLC闪存驱动器。这一设计使得系统能够充分满足AI训练、仿真计算以及大规模并行处理等对计算和数据吞吐要求严苛的场景。QLC(Quad-Level Cell)闪存技术的应用,以其高存储密度和成本效益,在确保大容量的同时兼顾了性能需求。
值得关注的是,新系统还包含了对英伟达Spectrum-X以太网交换机的支持。这一集成能够显著缩短模型训练过程中的检查点保存时间,这对于迭代周期长、数据集庞大的AI模型训练至关重要。IBM将这些硬件层面的互联互通视为关键,尤其是在需要快速数据移动以维持活跃的GPU集群和复杂调度机制的环境中,确保数据流的顺畅和高效。
在软件层面,IBM同步更新了其Storage Scale System软件,发布了7.0.0版本,以充分匹配存储总容量的提升。新版本增加了对更高容量模块的支持,并引入了更广泛的纠删码(Erasure Coding)技术,具体采用了16+2配置,旨在进一步提升存储效率和数据弹性。
性能方面也得到了全面增强。为配合吞吐量和每秒输入/输出操作数(IOPS)的提升,写入性能也相应得到了优化。根据此前的评估数据,四机架配置的系统容量约为2.2PB,IOPS可达1300万次,读取速度最高可达每秒330GB。而2025年的此次更新,将IOPS上限提升至2800万次,读取吞吐量也提高到每秒340GB。这些调整旨在确保,即使工作负载规模不断扩大,扩展后的硬件也不会引入新的延迟,保持整体系统性能的稳定性。
全闪存扩展柜为操作人员提供了一个高密度的存储选项,使其能够以SSD层作为主要存储基础,同时继续利用云存储进行核心数据中心以外的数据分发。IBM表示,容量的增加使得其全局缓存层能够将更大的活动数据集更接近GPU,从而有效地消除了传统数据孤岛,并保持了数据处理管线的持续稳定运行。
该架构的核心设计理念是为那些需要节点间信息可预测移动的集群提供服务,特别是在重度计算窗口期间CPU利用率显著上升的场景。例如,在分子动力学模拟、基因组测序、金融风险分析等领域,数据的快速、稳定流动对于计算效率至关重要。
IBM将此次更新定位为在更高密度、更优数据处理能力和更广泛工作负载支持三个维度上的全面改进。然而,从长远来看,该系统在实际部署并以满负荷状态运行时,其性能表现的持续稳定性,将是衡量此次升级最终影响的关键。新媒网跨境认为,随着全球数字化转型的深入和AI技术的普及,对高性能、高容量存储系统的需求将持续增长,IBM此次升级正是对此趋势的积极响应。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/ibm-storage-up-3x-to-47pb-for-ai-hpc.html


粤公网安备 44011302004783号 













