灵犀智能

最新信息

部分指标赶超英伟达!国产首款400G原生RDMA问世
2026-03-12 22:21:00

  算力新基建赛道迎来突破。
  3月12日,中科曙光正式发布首款国产400G原生无损RDMA高速网络——scaleFabric。据悉,该系列网络产品技术规格全面对标英伟达NDR,部分指标实现赶超。
  与此同时,该系统方案目前已完成近万卡规模验证,并稳定运行超过10个月,可保障大规模集群长期稳定运行,有效填补国产集群“高速互联”技术空白。
国产原生RDMA重大突破
部分指标赶超英伟达
  随着大模型训练与智算集群规模持续扩大,网络对超低延迟、超高带宽和无损传输的要求不断提高,RDMA(译为“远程直接内存访问”,是一种高效的网络通信协议)高速网络正成为智算集群的“算力大动脉”。
  中科曙光高速网络互联产品部总工程师万伟在发布会现场表示,scaleFabric是国内首款原生无损RDMA高速网络,面向超大规模智算集群设计,从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件均实现自主研发,构建起从硬件到软件的完整技术体系。
  “此次发布的scaleFabric400系列网络产品技术规格全面对标英伟达NDR,部分指标实现赶超。”万伟介绍,比如性能方面,scaleFabric400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展。这一性能组合,可充分满足万卡级AI训练集群对高带宽、低时延网络的极致需求。
  此外,稳定性与扩展能力上,产品采用基于信用的无损流控机制,从根源规避拥塞丢包风险,链路故障恢复时间小于1毫秒,已支撑近万卡集群持续稳定运行验证超10个月。
  万伟介绍,与英伟达NDR相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。
万卡集群已率先在郑州落地应用
  今年初,国家超算互联网核心节点在郑州正式上线试运营,该节点部署了3套国产万卡级scaleX智算集群系统,总规模达3万卡,承载起国家级AI算力网络基座的重任,而支撑这一集群高效运转的核心,正是scaleFabric。
  中科曙光高级副总裁李斌在发布会现场表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态也正在加速形成。
  运行数据显示,该网络系统在大规模集群环境中保持稳定运行,可支持跨POD组网及大规模并行训练任务,为国产原生无损RDMA网络在高端智算基础设施中的应用提供了实践验证。
  据介绍,依托在高性能计算、存储与网络领域的长期技术积累,中科曙光已逐步形成“算—存—网”协同发展的完整算力底座能力,为大规模AI基础设施提供系统级支撑。此次国产原生RDMA网络的落地,意味着我国在智算互联这一关键环节开始形成自主技术路径,补齐了我国智算基础设施中的关键一环。
(文章来源:上海证券报)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

灵犀智能

sitemap