人工智能计算中心存储方案
点燃GPU引擎,释放无限算力潜能
方案背景
——
“算力发展水平已经成为衡量国家经济社会发展的重要指标”
计算力指数平均每提高1个点,数字经济和地区生产总值将分别增长3.5%和1.8% 。
存储挑战
存储系统需要具备极高的读写性能与低延迟响应能力,以支持万亿级参数模型的高效数据处理和满足实时或高并发场景下的应用性能需求。
高性能存储
存储系统需要具备出色的容量扩展性,以应对 PB 至 EB 级别的数据量增长,并能够高效管理成百上千节点及数亿文件,满足大规模 AI 模型不断增长的数据存储与处理需求。
灵活扩展
需优化存算比例配置,以实现数据的高效流动和共享,减少延迟和功耗,从而最大化系统性能和模型训练效率。
存算协同
解决方案
泛联信息面向智算中心的需求,推出了基于UbiPower 18000分布式全闪存系统的高速数据处理解决方案,以实现超高性能和可扩展性。该方案采用了先进的高性能分布式并行文件系统,优化了 NVMe SSD 以及高速无损网络的数据访问和效率,不仅确保了对大文件的高带宽传输,同时还优化了对海量小文件的处理能力。该解决方案以高带宽、高吞吐、低时延和高 IOPS 的卓越存储性能,为智算中心提供了强大的支持,使其能够充分发挥 GPU 算力集群的最大效能。
方案价值
极致性能
具备极高的读写性能与低延迟响应能力,以支持万亿级参数模型的高效数据处理和满足实时或高并发场景下的应用性能需求。
轻松应对 PB 至 EB 级别数据量增长,并能够高效管理成百上千节点及数亿文件,满足大规模 AI 模型不断增长的数据存储与处理需求。
数据流转
支持AI/DL计算数据生命周期策略,支持全局统一的命名空间管理,降低数据管理和迁移复杂度。