DApp Store | Web3 Hub for hendelser og spill

Populære emner

Tomasz Tunguz

En billion tokens per dag. Er det mye? "Og når vi ser snevert på bare antall tokens som betjenes av Foundry APIer, behandlet vi over 100 tonn tokens dette kvartalet, opp 5 ganger fra år til år, inkludert rekordhøye 50 tonn tokens bare forrige måned." I april delte Microsoft en statistikk som avslørte at Foundry-produktet deres behandler rundt 1,7 tonn tokens per måned. I går delte Vipul behandler 2t åpen kildekode-slutning daglig. I juli kunngjorde Google et svimlende antall: "På I/O i mai kunngjorde vi at vi behandlet 480 billioner månedlige tokens på tvers av overflatene våre. Siden den gang har vi doblet dette antallet, og behandler nå over 980 billioner månedlige tokens, en bemerkelsesverdig økning." Google behandler 32,7 tonn daglig, 16 ganger mer enn Together og 574 ganger mer enn Microsoft Foundrys aprilvolum. Fra disse figurene kan vi trekke noen hypoteser: 1. Åpen kildekode-slutning er en ensifret brøkdel av slutningen. Det er uklart hvor stor del av Googles slutningstokens som er fra deres åpen kildekode-modeller som Gemma. Men hvis vi antar at Anthropic og OpenAI er 5t-10t-tokener per dag og alle lukket kildekode, pluss at Azure er omtrent lik i størrelse, er åpen kildekode-slutning sannsynligvis rundt 1-3 % av den totale slutningen. 2. Agenter er tidlig. Microsofts datapunkt antyder at agentene i GitHub, Visual Studio, Copilot Studio og Microsoft Fabric bidrar med mindre enn 1 % av den totale AI-slutningen, på Azure. 3. Med Microsoft forventet å investere 80 milliarder dollar sammenlignet med Googles 85 milliarder dollar i AI-datasenterinfrastruktur i år, bør AI-inferensarbeidsbelastningen til hvert selskap øke betydelig både gjennom maskinvare som kommer online og algoritmiske forbedringer. "Gjennom programvareoptimalisering alene leverer vi 90 % flere tokens for samme GPU sammenlignet med for et år siden." Microsoft presser mer digital limonade fra GPUene sine, og Google må også gjøre det samme. Når vil vi se de første 10t eller 50t AI-tokenene behandlet per dag? Det kan ikke være langt unna nå. - Estimater fra løse luften! - Google og Azure med 33 tonn tokens per dag hver, Together og 5 andre neoclouds med omtrent 2 tonn tokens per dag hver, og Anthropic & OpenAI med 5 tonn tokens per dag, gir oss 88 tonn tokens per dag. Hvis vi antar at 5 % av Googles tokens er fra åpen kildekode-modeller, er det 1,65 tonn tokens per dag, eller omtrent 1,9 % av den totale slutningen. Igjen, veldig grov matematikk

Topp

Rangering

Favoritter