一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Chris McGuire

前 NSC、OSTP、州、国防部和 NSCAI |中国科技、人工智能、半导体 |所有观点都是我自己的

我计划很快写一篇关于华为AI芯片路线图的更详细分析，但简而言之，它并不令人印象深刻，并且突显出华为预计美国和中国在AI芯片方面的差距将在未来几年显著扩大： 1️⃣ 华为计划明年生产的AI芯片的处理能力和内存带宽比他们今天生产的最佳芯片要低。这非常奇怪。 2️⃣ 华为计划在2028年第四季度之前，不会生产出与Nvidia现在想要运送到中国的B30A同样强大的芯片。 3️⃣ 到2027年（Nvidia路线图的最后一年），Nvidia最好的AI芯片的处理能力将是华为最佳AI芯片的27倍。华为自己认为，由于Nvidia使用更先进的工艺节点，而华为由于工具出口管制仍停留在7nm/5nm节点，华为将进一步落后。华为的计划是用数量更多但性能更差的芯片进行竞争，但他们生产足够的芯片来弥补这一能力差距并不现实。华为/中芯国际必须在2027年前将其Ascend生产能力提升数百倍甚至数千倍，才能生产出与Nvidia相当的AI计算能力。这是极不可能的。如果华为无法制造出许多集群，那么无论他们能在一个集群中放入多少中等水平的芯片都没有意义。而且这还不包括由于HBM供应或潜在的新美国工具出口管制所带来的限制。只要我们不放弃，美国的AI硬件优势预计将在不久的将来大幅增长。

今天最重要的中国科技新闻是华为的芯片路线图公告及相关突破。关键要点：路线图： 910C（2025年），950PR/DT（2026年），960（2027年），970（2028年）。表明计算、带宽和内存扩展的升级节奏稳定。内存自给自足：从950系列开始，华为将使用自研的HBM高带宽内存（HiBL 1.0，HiZQ 2.0），减少对外国供应商的依赖，建立供应链独立性。与NVIDIA的战略定位： NVIDIA的Blackwell Ultra GB300在单芯片级别仍然遥遥领先（15 PFLOPS FP4）。华为承认差距，但强调互连和集群级别的扩展，声称在超节点计算能力上处于领先地位。请参见下面的引用。集群雄心：新的Atlas SuperPoDs到2027年可扩展至15,488张卡，尽管芯片较弱，但允许总计算能力与竞争对手相媲美或超越。华为押注于系统级性能，而不仅仅是芯片规格。跨领域扩展： TaiShan 950 SuperPoD（2026年）超越AI，面向通用计算，目标是曾经由大型机承担的角色。以下是对《新智讯》报道的翻译： “在2025年华为全连接大会上，轮值主席徐直军揭晓了公司的最新Ascend AI芯片路线图。在2025年第一季度，华为推出了Ascend 910C。在2026年第一季度，将发布Ascend 950PR，随后在第四季度发布Ascend 950DT。在2027年第四季度，Ascend 960计划发布，Ascend 970将在2028年第四季度到来。 Ascend 910C基于SIMD架构，提供高达800 TFLOPS（FP16）的性能，支持FP32/HF32/FP16/BF16/INT8格式，784 GB/s的互连带宽，128 GB HBM，以及3.2 TB/s的内存带宽。 Ascend 950PR/DT将升级为SIMD/SIMT架构，达到1 PFLOPS（FP8）/2 PFLOPS（FP4）。它将支持更广泛的格式（FP32到FP4），互连带宽为2 TB/s。内存规格： 950PR：144 GB，4 TB/s带宽。 950DT：128 GB，1.6 TB/s带宽。 Ascend 960将性能翻倍，达到2 PFLOPS（FP8）/4 PFLOPS（FP4），互连带宽为2.2 TB/s，HBM扩展至288 GB，带宽为9.6 TB/s。 Ascend 970将再次将计算能力翻倍，达到4 PFLOPS（FP8）/8 PFLOPS（FP4），互连带宽为4 TB/s。HBM容量将保持在288 GB，但带宽将上升至14.4 TB/s。重要的是，从950PR开始，华为的Ascend芯片将采用自研的HBM。950将配备HBM HiBL 1.0，而950DT将升级为HBM HiZQ 2.0。作为比较，NVIDIA的Blackwell Ultra GB300提供15 PFLOPS（FP4）的计算，配备288 GB的HBM3e内存和8 TB/s的带宽。徐直军承认： “由于美国的制裁，我们无法在台积电制造我们的芯片，因此我们的单芯片性能仍然落后于NVIDIA。但华为在连接人和机器方面有超过三十年的经验。通过大量投资互连技术，我们取得了突破，使我们能够构建数万张卡的超节点。这使我们能够在系统级别提供世界上最强大的计算能力。” 他强调，计算能力一直是、并将继续是人工智能的关键——尤其是中国的AI。在他看来，超节点将成为AI基础设施的新常态。华为的CloudMatrix 384超节点已经在300多套中部署，为20多家客户服务。展望未来，华为计划在2025年第四季度推出Atlas 950 SuperPoD，配备8,192张卡，声称将是全球最强大的超节点。一个更大的Atlas 960 SuperPoD，配备15,488张卡，计划在2027年第四季度推出。徐还揭晓了全球首个通用计算超节点TaiShan 950 SuperPoD。基于Kunpeng 950，支持最多16个节点（32个处理器），48 TB内存，以及内存、SSD和DPU资源的池化。计划在2026年第一季度发布。徐将其描述为“大型机和小型机的终结。”