热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Chris McGuire
前 NSC、OSTP、州、国防部和 NSCAI |中国科技、人工智能、半导体 |所有观点都是我自己的
我计划很快写一篇关于华为AI芯片路线图的更详细分析,但简而言之,它并不令人印象深刻,并且突显出华为预计美国和中国在AI芯片方面的差距将在未来几年显著扩大:
1️⃣ 华为计划明年生产的AI芯片的处理能力和内存带宽比他们今天生产的最佳芯片要低。这非常奇怪。
2️⃣ 华为计划在2028年第四季度之前,不会生产出与Nvidia现在想要运送到中国的B30A同样强大的芯片。
3️⃣ 到2027年(Nvidia路线图的最后一年),Nvidia最好的AI芯片的处理能力将是华为最佳AI芯片的27倍。
华为自己认为,由于Nvidia使用更先进的工艺节点,而华为由于工具出口管制仍停留在7nm/5nm节点,华为将进一步落后。
华为的计划是用数量更多但性能更差的芯片进行竞争,但他们生产足够的芯片来弥补这一能力差距并不现实。华为/中芯国际必须在2027年前将其Ascend生产能力提升数百倍甚至数千倍,才能生产出与Nvidia相当的AI计算能力。这是极不可能的。如果华为无法制造出许多集群,那么无论他们能在一个集群中放入多少中等水平的芯片都没有意义。
而且这还不包括由于HBM供应或潜在的新美国工具出口管制所带来的限制。只要我们不放弃,美国的AI硬件优势预计将在不久的将来大幅增长。

Rui Ma9月18日 16:27
今天最重要的中国科技新闻是华为的芯片路线图公告及相关突破。
关键要点:
路线图:
910C(2025年),950PR/DT(2026年),960(2027年),970(2028年)。
表明计算、带宽和内存扩展的升级节奏稳定。
内存自给自足:
从950系列开始,华为将使用自研的HBM高带宽内存(HiBL 1.0,HiZQ 2.0),减少对外国供应商的依赖,建立供应链独立性。
与NVIDIA的战略定位:
NVIDIA的Blackwell Ultra GB300在单芯片级别仍然遥遥领先(15 PFLOPS FP4)。
华为承认差距,但强调互连和集群级别的扩展,声称在超节点计算能力上处于领先地位。请参见下面的引用。
集群雄心:
新的Atlas SuperPoDs到2027年可扩展至15,488张卡,尽管芯片较弱,但允许总计算能力与竞争对手相媲美或超越。
华为押注于系统级性能,而不仅仅是芯片规格。
跨领域扩展:
TaiShan 950 SuperPoD(2026年)超越AI,面向通用计算,目标是曾经由大型机承担的角色。
以下是对《新智讯》报道的翻译:
“在2025年华为全连接大会上,轮值主席徐直军揭晓了公司的最新Ascend AI芯片路线图。
在2025年第一季度,华为推出了Ascend 910C。
在2026年第一季度,将发布Ascend 950PR,随后在第四季度发布Ascend 950DT。
在2027年第四季度,Ascend 960计划发布,Ascend 970将在2028年第四季度到来。
Ascend 910C基于SIMD架构,提供高达800 TFLOPS(FP16)的性能,支持FP32/HF32/FP16/BF16/INT8格式,784 GB/s的互连带宽,128 GB HBM,以及3.2 TB/s的内存带宽。
Ascend 950PR/DT将升级为SIMD/SIMT架构,达到1 PFLOPS(FP8)/2 PFLOPS(FP4)。它将支持更广泛的格式(FP32到FP4),互连带宽为2 TB/s。内存规格:
950PR:144 GB,4 TB/s带宽。
950DT:128 GB,1.6 TB/s带宽。
Ascend 960将性能翻倍,达到2 PFLOPS(FP8)/4 PFLOPS(FP4),互连带宽为2.2 TB/s,HBM扩展至288 GB,带宽为9.6 TB/s。
Ascend 970将再次将计算能力翻倍,达到4 PFLOPS(FP8)/8 PFLOPS(FP4),互连带宽为4 TB/s。HBM容量将保持在288 GB,但带宽将上升至14.4 TB/s。
重要的是,从950PR开始,华为的Ascend芯片将采用自研的HBM。950将配备HBM HiBL 1.0,而950DT将升级为HBM HiZQ 2.0。
作为比较,NVIDIA的Blackwell Ultra GB300提供15 PFLOPS(FP4)的计算,配备288 GB的HBM3e内存和8 TB/s的带宽。
徐直军承认:
“由于美国的制裁,我们无法在台积电制造我们的芯片,因此我们的单芯片性能仍然落后于NVIDIA。但华为在连接人和机器方面有超过三十年的经验。通过大量投资互连技术,我们取得了突破,使我们能够构建数万张卡的超节点。这使我们能够在系统级别提供世界上最强大的计算能力。”
他强调,计算能力一直是、并将继续是人工智能的关键——尤其是中国的AI。在他看来,超节点将成为AI基础设施的新常态。华为的CloudMatrix 384超节点已经在300多套中部署,为20多家客户服务。
展望未来,华为计划在2025年第四季度推出Atlas 950 SuperPoD,配备8,192张卡,声称将是全球最强大的超节点。一个更大的Atlas 960 SuperPoD,配备15,488张卡,计划在2027年第四季度推出。
徐还揭晓了全球首个通用计算超节点TaiShan 950 SuperPoD。基于Kunpeng 950,支持最多16个节点(32个处理器),48 TB内存,以及内存、SSD和DPU资源的池化。计划在2026年第一季度发布。徐将其描述为“大型机和小型机的终结。”

191
热门
排行
收藏