首页 > 事件详情
OpenAI发布MRC、智谱落地ZCube,大模型厂商同步押注下一代网络架构
近日,智谱联合驭驯网络、清华大学在GLM-5.1的线上生产推理集群中,成功规模化落地了新一代网络架构ZCube。
随着大模型推理需求爆发,特别是Prefill与Decode阶段分离部署后,集群内的数据传输呈现出高度的动态不对称性。传统网络拓扑会因结构性问题产生难以调优的链路拥塞与热点堆积等问题,成为制约万卡级集群性能释放的瓶颈。
智谱ZCube架构以完全扁平化的GPU互联方式,通过“单轨+多轨”混合接入的扁平化拓扑设计,确保全网任意两张GPU有且仅有一条存在唯一最优路径,从而在架构层面实现了网络流量的理想负载均衡。这一创新被网络领域顶会ACM SIGCOMM 2025评价为“显著改变整个行业对网络的认知方式”。
该架构在不新增或更换任何GPU、服务器,且软件栈与业务代码零改动的前提下,成功将集群推理吞吐提升了15%以上,并将TTFT P99尾时延降低了40.6%。其所需的交换机与光模块硬件成本较传统方案节省了33%。在万卡规模下,仅网络硬件一项即可节省投资约2.1亿至6.4亿元。
几乎在同一时期,OpenAI联合NVIDIA、AMD、Intel、Microsoft、Broadcom等五大巨头发布了MRC协议,并已部署于其最大规模超算集群。两大领先模型厂商同时动作,共同印证了网络已成为超大规模AI基础设施竞争的新战场。