华为张修征:今年上半年 CloudMatrix 384 超节点将有数万规模上线,有望“彻底终结算力焦虑”
GoodNav 4月11日的消息,《科创板日报》报道,华为公司副总裁张修征今日透露,华为云 CloudMatrix 384 超节点将在今年上半年上线数万规模,这有望彻底缓解算力不足的问题。未来,CloudMatrix 超节点将能够构建超过万片的大型集群来提供计算能力。
据报道,4月10日,华为云生态大会2025在安徽芜湖举行,华为常务董事兼华为云计算CEO张平安公布了AI基础设施架构的进展,推出了 CloudMatrix 384 超节点,并宣布已经在芜湖数据中心大规模上线。
华为云 CloudMatrix 384 超节点能够实现从服务器级到矩阵级的资源供应模式转变,具有“高密度”“高速”“高效”的特性,通过架构创新,在计算能力、网络带宽、内存带宽等方面实现领先。
华为云还表示,正在持续优化昇腾AI云服务,目前已全面适配包括DeepSeek在内的160多个第三方大模型,为大模型的训练和推理提供可靠保障,支持行业应用的快速落地。此外,华为云盘古大模型已成功应用于30多个行业和400多个场景,包括城市治理、智慧金融、医疗健康和气象预测等领域。
硅基流动还宣布将与华为云合作,基于CloudMatrix 384 超节点的昇腾云服务和高性能推理框架SiliconLLM,正式上线大规模专家并行最佳实践DeepSeek-R1。
硅基流动介绍,该服务在保证单用户20 TPS水平的基础上,单卡解码吞吐量突破1920 Tokens/s,性能可与H100部署相媲美。同时,经过主流测试集验证和大规模线上盲测,昇腾算力部署的DeepSeek-R1模型精度与DeepSeek官方保持一致。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...