Sukella @nvidia 🐰 Hopper vs ⚙️ Blackwell GPU -arkkitehtuureihin – peräkkäisiä harppauksia tekoälytyökuormien👇 laskentatehossa ja yhteyksissä
🐰 Hopper (H100 & H200) esitteli neljännen sukupolven Tensor-ytimet + FP8 Transformer Enginen, mikä antoi jopa 9× nopeamman harjoittelun ja 30× nopeamman päättelyn verrattuna A100:aan. ⚙️ Blackwell (B200) – joka toimitetaan vuoden 2024 lopulla – yhdistää kaksi muottia 10 TB/s NV-HBI:n yli, lisää FP4:n ja käyttää NVLink-5:tä jopa 30 × klusterin päättelyyn.
@nvidia 🐰 Hopperin tekniset tiedot Tensoriytimet: sekoitettu FP8/FP16/TF32 Muisti: - H100 → 80 Gt HBM3 @ 3,35 TB/s - H200 → 141 Gt HBM3e @ 4,8 TB/s NVLink: jopa 900 Gt/s GPU:ta kohden
@nvidia 🐰 Hopper toiminnassa Vertailuarvot osoittavat, että H200 antaa Llama-2 70B -päättelyn 45–100 % nopeammin kuin H100. ⚠️ Molemmissa oli toimituspulaa vuosina 2023–25. 💻 Hyperbolicin pilvessä: H100 virtuaalikoneet ja paljasmetalliklusterit Ethernet + InfiniBandilla alkaen $1.49/h. H200 & B200 välittömän tarjouksen kautta.
@nvidia ⚙️ Blackwellin innovaatiot - Sirurakenne (TSMC 4NP, 208 B-transistorit, 10 TB/s NV-HBI) - 2. sukupolven Transformer Engine: FP4 + parannettu FP8 - NVLink-5: 18 linkkiä @ yhteensä 1,8 TB/s - Dekompressiomoottori: 800 Gt/s CPU↔GPU - Täysi RAS ja luottamuksellinen laskenta
📊 Suorituskyvyn vertailu H100 SXM: 80 Gt @ 3,35 Tt/s, 3,96 PFLOPS (FP8), 1,98 PFLOPS (FP16), 67 TFLOPS (FP32), NVLink 900 Gt/s, 700 W H200 SXM: 141 Gt @ 4,8 Tt/s, sama laskenta PFLOPS/TFLOPS, NVLink 900 Gt/s, 700 W HGX B200: 180 Gt @ 7,7 TB/s, 9 PFLOPS (FP8), 4,5 PFLOPS (FP16), 75 TFLOPS (FP32), NVLink 1,8 TB/s, 1000 W
@nvidia ❓ Mikä on FLOP? 1 liukulukutoiminto (lisäys/mul) 1 TFLOP = 10¹² operaatiota/s 1 PFLOP = 10¹⁵ ops/s = 1000× TFLOP Nämä mittarit osoittavat, kuinka nopeasti GPU:t murskaavat tekoälyn koulutuksen ja HPC:n takana olevan massiivisen matematiikan.
@nvidia 🔚 Yhteenveto: 🐰 Hopper asetti riman FP8:n sekatarkkuudella ja asynkronisilla putkilla. ⚙️ Blackwell työntää seuraavan sukupolven FP4:llä, enemmän muistia ja NVLink-5:llä. H100 on edelleen työjuhta – vuokra 1,49 dollaria tunnissa. H200 & B200 saatavilla pyynnöstä
@nvidia Lue koko artikkeli osoitteessa:
4,11K