欢迎光临北京软件和信息服务业协会官方网站
特斯联异构超节点T-Cluster 512:释放“算力×联接”效应!
发布日期:2026-01-20    来源:特斯联Smart    分享到:

近日,AIoT企业特斯联发布升级版T-Cluster 512超节点架构。新版本T-Cluster 512针对高速互联、能效优化、稳定性三个层面进行了全面优化,实现互联带宽超8倍提升,液冷超70%覆盖,PUE低至1.08。基于T-Cluster 512,1MW智算中心可实现年节电10%以上。


绿色集约、开放融合成刚需,特斯联发布T-Cluster超节点


随着大模型、智能体等新一代AI技术走向普及,算力已从“高性能计算工具”跃升为国家战略资源与数字经济的基石,驱动AI算力需求呈指数级增长。据统计,模型参数每扩大10倍,算力需求通常需增长30至50倍。在此背景下,我国AI芯片供给呈多元化发展,然而,传统计算架构在通信延迟、功耗散热和系统复杂度等方面的局限日益突显。随着单卡性能提升空间减小,以更低成本实现高带宽互联、更密集封装、更高能效系统成为AI纵深发展的下一步方向。


特斯联T-Cluster系列产品即为针对千亿乃至万亿参数大模型训推设计的智算集群产品。其中T-Cluster 512的高算力密度设计能够显著提升训练效率,为从中小规模模型训练到超大规模参数迭代的全场景智算任务提供智算中心系统性支撑。


T-Cluster 512是特斯联专为异构混合训推打造的超节点产品。包含8个计算机柜及2个交换机柜,单柜可配64张AI加速卡,通过16个高性能计算节点与8个专用交换节点的协同设计,实现共512异构智算节点的全向互联,能够在有限空间内迸发极致算力,总算力规模超过500PFlops。


8b1a3443-30e0-444f-883e-898b196a8455.png


在系统设计层面,T-Cluster 512采用分层级的算力配置,以高密度集成计算单元(如GPU/NPU)为核心,通过Scale-up与Scale-out网络协同优化,突破传统分布式计算的异构兼容、通信瓶颈与资源碎片化挑战。


▶ 异构兼容设计:兼容GPGPU、ASIC等架构,支持多种异构AI加速卡协同高效运行,实现从国产AI芯片到国际主流硬件的无缝适配,有效规避硬件依赖,提升系统的灵活性和适应性。截至目前,T-Cluster 512业已实现对昆仑芯、燧原、天数智芯、摩尔线程、沐曦、壁仞、曦望等10+信创芯片的兼容适配。


▶ 高扩展性与灵活性:采用柜内卡间全互联通信设计,片间互联带宽提升8倍,单机柜训练性能提升10倍,单卡推理效率提升80%。集群支持从512张AI加速卡扩展到万卡级别,算力规模可弹性扩展至10+ EFlops。


▶ 多节点融合设计:通过集成多个计算节点,实现近似单机的性能扩展效率,显著降低分布式计算中的通信开销和资源碎片化问题。系统同时支持动态资源分配,可根据任务类型智能调度算力,整体资源利用率提升至70%。


除此之外,T-Cluster 512还尤其具备超高速互联、绿色高效、安全稳定的特性。


超高速互联:片间互联带宽8倍提升,柜间互联总带宽超25.6TB/s


作为连接成千上万张AI加速卡的“高速公路”,互联技术是超大规模集群/超节点得以稳定高效输出的关键。T-Cluster 512采用多层次创新技术,确保数据传输的高带宽和低时延。


▶ 高速互联:集成多种高速互联技术,构建专属通信域,支持512张AI加速卡超高速互联,互联带宽实现8倍以上提升,柜间互联总带宽超25.6 TB/s。


▶ 无损网络架构:采用RoCEv2(RDMA over Converged Ethernet v2)无损网络技术,网络时延从微秒级降至百纳秒级,极大减少加速卡等待数据同步的空闲时间。


▶ 有效带宽利用率超90%,实现近零丢包传输效果,提升分布式训练的效率及稳定性。


▶ 全互联设计与扩展性:短距离采用低成本、高可靠的铜缆直连,实现多卡全互联通信;长距离采用光纤。通过cable tray及高速连接器优化布局,单柜最大可支持64张AI加速卡,并可灵活扩展,确保系统在规模扩展时的性能一致性。


值得注意的是,T-Cluster 512创新地采用了Scale-up与Scale-out相融合的高可用互联技术,在机柜内通过多级交换全互联拓扑结构,实现单机柜64张异构AI加速卡的全互联;在机柜间通过高性能的Scale-out网络将多个超节点横向连接,形成“超节点内全互联 + 超节点间高速网络”的两层异构混合架构,为更大规模集群奠定基础。


此种互联模式在实现硬件异构互联升级的同时,更使软件能力实现跃升,驱动AI计算范式的迁移。一方面Scale-up + Scale-out的高可用互联尤其适合承载大模型训练中张量并行所需的频繁梯度同步,以及混合专家模型(MoE)中动态路由带来的All-to-All通信,将大部分通信开销消化在机柜内部;另一方面,其同时支持Prefill-Decode分离(PD分离)等先进推理范式。


在特斯联看来,在AI算力基础设施中,网络性能与计算性能并非简单的叠加关系,而是深度融合、相互定义的乘数效应,即“算力×联接”。“Scale-up+Scale-out”的高可用互联技术得以将“算力×联接”的理念转化为可度量的性能提升,为突破万亿参数大模型的“通信墙”提供了坚实的底层基础设施。


df3706ff-1225-4298-86b4-d0e6a2ee51f1.png


能效优化:70%液冷覆盖,PUE低至1.08


在智算需求攀升与“双碳”目标落地的双重压力下,能效优化及高效散热方案直接决定着超节点高密度集成设计的稳定、经济运行,亦是超节点从实验室走向大规模应用的物理基础。T-Cluster 512在能效优化方面,深度融合液冷技术,有效实现了高性能与低能耗的平衡。


▶ 液冷为主,风冷为辅:采用高性能冷板式液冷散热系统,液冷覆盖率超过70%,并结合风冷辅助,实现了高效散热与低能耗的双重优化,使单柜设计最大功率达120KW,同时整机功耗降低,服务器节能率提升30%以上,PUE低至1.08。


▶ 全栈液冷解决方案:实现从液冷机柜、电源系统到冷却液全链条覆盖。液冷机柜采用高功率设计(单柜120KW),全液温控技术确保整机压降低于80Kpa,支路流量均匀度≥95%;CDU(冷却分配单元)结合智能监控,能效比(EER)≥100,高于行业3%以上,二次侧水温控制精度达±0.5℃。


安全稳定:数字孪生+智能运维,千卡有效训练时间超95%


为保障大规模训推任务的高效稳定运行,T-Cluster 512通过多层次安全与运维设计,保障系统长期稳定运行。


▶ 超节点数字孪生:采用物理集群数字孪生技术,实现故障定位、修复等全流程可视化智能管理。


▶ 智能体融合+立体化运维:搭载智能运维系统,融合智能体技术,解耦高密机柜依赖,降低稳定性风险。运维智能体可实时监控120+种算力资源和基础设施资源,覆盖1,500+项指标,自主执行故障预警、问题定位、故障隔离等操作,实现业务无感修复。据测算,基于该系统,运维告警处理时效提升60%,故障恢复时间降低40%,可靠性提升300%以上,千卡有效训练时间超95%。


▶ 安全与隐私保护:采用零信任架构设计及TLS/MACsec协议,全方位保障用户数据安全与隐私。系统支持等保三级交付标准,通过加密通信和访问控制,防止未授权访问。


▶ 高可用性设计:采用环形分配管网冗余架构,配置双阀支持单机退出,确保系统在部分故障时仍可运行。


从生成式智能到物理智能,特斯联构建高效易用混合算力底座


作为我国AIoT行业的开拓者,自AI 1.0时代,特斯联便以AIoT技术为核心,打通万物互联链路,推动楼、社、园、城等各类空间场景完成产业数智化转型;AI 2.0时代,特斯联进一步将AIoT核心能力延伸至“算力”与“智能体”领域,通过构建机器在物理空间中的“感知-计算-推理-决策”闭环,深度落地空间智能,助力产业实现可持续的数智化转型目标。


在算力端,特斯联聚焦异构信创芯片的融合训推,现已推出T-Nexus系列智算服务器、T-Infer系列场景一体机、T-Cluster系列智算集群及超节点等代表性产品,并通过搭载ThiCP混合智算平台,实现对CANN、Neuware、MUSA、MXMACA等不同计算架构的兼容。其中,T-Cluster 512异构超节点互联架构的探索,是对AI算力基础设施从“粗放堆砌”向 “精细协同” 演进的重要实践。它通过系统工程创新,将Scale-up+Scale-out互联、高密供电、液冷散热等技术深度融合,直击“通信墙”痛点。目前,特斯联已积极布局向1024卡及以上更大规模超节点的研发,旨在将异构超节点本身作为构建更大规模智算中心的 “超级积木”,以形成 “超节点内全互联 + 超节点间高速网络” 的两层优化异构混合架构,以系统性突破万卡乃至十万卡集群的算力效率瓶颈。


值得注意的是,面向物理AI时代,特斯联依托成立十年来沉淀的近万空间智能项目案例,亦构建了基于异构智算集群的空间数据生成引擎及仿真模拟平台,以加速空间智能及具身智能的训练。


特斯联期待持续携手产业链上下游伙伴,构建兼容更广泛、使用更灵活的混合算力平台,为千行百业源源不断输出智算动力。

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.