Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sukella @nvidia 🐰 Hopper vs ⚙️ Blackwell GPU -arkkitehtuureihin – peräkkäisiä harppauksia tekoälytyökuormien👇 laskentatehossa ja yhteyksissä

🐰 Hopper (H100 & H200) esitteli neljännen sukupolven Tensor-ytimet + FP8 Transformer Enginen, mikä antoi jopa 9× nopeamman harjoittelun ja 30× nopeamman päättelyn verrattuna A100:aan.
⚙️ Blackwell (B200) – joka toimitetaan vuoden 2024 lopulla – yhdistää kaksi muottia 10 TB/s NV-HBI:n yli, lisää FP4:n ja käyttää NVLink-5:tä jopa 30 × klusterin päättelyyn.


@nvidia 🐰 Hopperin tekniset tiedot
Tensoriytimet: sekoitettu FP8/FP16/TF32
Muisti:
- H100 → 80 Gt HBM3 @ 3,35 TB/s
- H200 → 141 Gt HBM3e @ 4,8 TB/s
NVLink: jopa 900 Gt/s GPU:ta kohden
@nvidia 🐰 Hopper toiminnassa
Vertailuarvot osoittavat, että H200 antaa Llama-2 70B -päättelyn 45–100 % nopeammin kuin H100.
⚠️ Molemmissa oli toimituspulaa vuosina 2023–25.
💻 Hyperbolicin pilvessä: H100 virtuaalikoneet ja paljasmetalliklusterit Ethernet + InfiniBandilla alkaen $1.49/h. H200 & B200 välittömän tarjouksen kautta.

@nvidia ⚙️ Blackwellin innovaatiot
- Sirurakenne (TSMC 4NP, 208 B-transistorit, 10 TB/s NV-HBI)
- 2. sukupolven Transformer Engine: FP4 + parannettu FP8
- NVLink-5: 18 linkkiä @ yhteensä 1,8 TB/s
- Dekompressiomoottori: 800 Gt/s CPU↔GPU
- Täysi RAS ja luottamuksellinen laskenta
📊 Suorituskyvyn vertailu
H100 SXM: 80 Gt @ 3,35 Tt/s, 3,96 PFLOPS (FP8), 1,98 PFLOPS (FP16), 67 TFLOPS (FP32), NVLink 900 Gt/s, 700 W
H200 SXM: 141 Gt @ 4,8 Tt/s, sama laskenta PFLOPS/TFLOPS, NVLink 900 Gt/s, 700 W
HGX B200: 180 Gt @ 7,7 TB/s, 9 PFLOPS (FP8), 4,5 PFLOPS (FP16), 75 TFLOPS (FP32), NVLink 1,8 TB/s, 1000 W
@nvidia ❓ Mikä on FLOP?
1 liukulukutoiminto (lisäys/mul)
1 TFLOP = 10¹² operaatiota/s
1 PFLOP = 10¹⁵ ops/s = 1000× TFLOP
Nämä mittarit osoittavat, kuinka nopeasti GPU:t murskaavat tekoälyn koulutuksen ja HPC:n takana olevan massiivisen matematiikan.
@nvidia 🔚 Yhteenveto:
🐰 Hopper asetti riman FP8:n sekatarkkuudella ja asynkronisilla putkilla.
⚙️ Blackwell työntää seuraavan sukupolven FP4:llä, enemmän muistia ja NVLink-5:llä.
H100 on edelleen työjuhta – vuokra 1,49 dollaria tunnissa.
H200 & B200 saatavilla pyynnöstä
@nvidia Lue koko artikkeli osoitteessa:
4,11K
Johtavat
Rankkaus
Suosikit