
最近,华为创始人Ren Zhengfei在对深圳人的《人气日报》的独家采访中谈到了筹码技术差距。关于芯片技术,Ren Zhengfei清楚地说,“华为的单一芯片仍然落后于美国”,但随后主题改变了:“我们使用数学来增加物理,非角质和使用组计算来增加单芯片,这也可以取得实际的结果。”是的,近年来,华为技术团队提出了三个创新:“使用数学来添加物理学”,“非摩尔法来增加摩尔法律”和“系统用来增加单点”,并成功创建了“超级节点 +集群”计算能力解决方案。这个“超级节点 +群集”系统是华为的Ascend CloudMatrix 384超级节点,它是全部华为堆栈开发的世界上最大的AI Super节点100%开发。它的外观成功打开了Nvidia -monpoly -Monpoly Gap。华为CloudMatrix 384已达到T他弯曲。 2025年4月,在华为的华为云生态会议上,华为执行董事兼Cloud Computing的首席执行官张平恩(Zhang Ping'an)开设了NVL72的Cloudmatrix384。的奥秘。带宽的记忆迟到了2.1倍,互连带宽增加到2.8Tbps,而断点恢复时间缩短到10秒。许多指标为AI计算能力的全球商业群集设置了新的注释。扩展全文
在单个Astro芯片的性能中,大约是NVIDIA GPU的GPU的三分之一,华为选择了完全不同的技术途径,以通过超大尺寸的集群设计实现系统级突破。
华为依赖于6812 400G光学模块构建的超高速度互联网网络,以启用数据,几乎没有损失384张卡,并且培训实践接近单卡的性能的90%,该卡高于60%-70%的传统建筑的水平。
根据半人分析,华为云CM384建立在384个上升芯片上,可以提供BF16的密集计算能力,最多300个Pflops,几乎是NVIDIA GB200 NVL72系统的两倍。
在美国技术持续阻塞的背景下,这项技术是成功的。基于硅的流量基于平台部署的DeepSeek-R1模型,实现了1920年/s的单卡解码吞吐量,这是Maicompare NVIDIA H100部署性能。
NVIDIA的主导地位将面临最大的挑战。
华为的迅速增长引起了NVIDIA高级管理层的高度警觉。从今年开始,NVIDIA首席执行官Huang Renxun多次提到华为,华为被认为是其最大的竞争对手之一。
Huang Renxun最近澄清了:“从技术参数来看,华为的CloudMatrix 384超级节点甚至超过了NVIDIA的性能,并且比NVIDIA切割技术更有好处,因此我们应该非常重视这一优势。面对挑战。
黄伦Xun的声明被该行业视为对中国巨型美国AI芯片竞争对手的技术实力的首次公众认可。
预计将重建全球市场结构的结构!
对于华为而言,CloudMatrix 384的野心不仅仅是技术基准测试,而是为中国技术行业计划采取一种深入的方法,以参与该规则的全球概述,因为华为在5G通信领域设定了标准。
接下来,华为将迫使该行业通过超节点体系结构放弃“单卡绩效竞争”,并将其竞争的重点转移到集群,TCO(总拥有成本)和生态协调的效率上。
这意味着,在过去,关注过程技术,单卡计算能力和视频内存能力的方向将接下来发生变化。使用计算强度clus的有效速度TER,断点恢复速度和生态协调是未来的方向,而先进的技术确实并不重要。
同时,华为还将吸引AI公司以其群集的好处加入Ascend System,并形成硬件软件模型闭环。目前,华为开发人员量表超过1200万,合作伙伴的数量为45,000,云商店的应用程序为12,000,它创建了一种可以与CUDA竞争的替代解决方案。
显然,在华为等中国科技公司的努力中,在计算电力战的下一个世界中,中国制造商将首次制定规则。随着CloudMatrix 384启动计划的推广,全球AI行业的垄断将完全破产!回到Sohu看看更多