国内运营商最大的单集群智能计算中心已在哈尔滨投入使用,能够训练拥有万亿参数的大型模型。
编辑日期:2024年09月02日
该智能计算中心具有单集群算力规模大和国产化网络设备组网规模大的特点。单集群智能计算中心将所有的AI加速卡集成为一个集群,用于支持拥有千万亿级参数的大模型进行训练。
据媒体报道,中国移动智算中心(哈尔滨)已实现AI芯片100%国产化,并首次采用国产网络设备探索了单集群1.8万张智算卡的部署规模上限。该中心能够提供6.9EFLOPS(即每秒690亿亿次半精度浮点运算)的智能算力,融合分级存储容量达到150P。此外,该中心还创新性地应用了多项中国移动自主研发的技术,如GSE1.0和天池SDN等。
该智能计算中心利用智能网络技术将上万块GPU芯片像“积木”一般连接在一起,大大提升了GPU节点之间的通信效率,使得数据训练所需时间减少了20%。由此组建的超级计算集群能够满足拥有万亿参数的大规模模型训练需求。