Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Dnes stavíme týmy v pyramidách. Jeden vedoucí, několik manažerů, mnoho individuálních přispěvatelů.
Jaká týmová konfigurace dává ve světě umělé inteligence největší smysl? Zde je několik alternativ:
Nejprve krátká pyramida. Manažeři se stávají agentskými manažery. Práce vykonávaná jednotlivými přispěvateli v minulosti se stává pracovní náplní agentů. Každý se v práci posouvá o úroveň abstrakce výš.
Tato konfigurace snižuje počet zaměstnanců o 85 % (1:7:49 -> 1:7). Poměr manažerů k jednotlivým přispěvatelům se pohybuje od 1:7 do 1:1. Poměr manažerů k agentům zůstává 1:7.
Za druhé, raketová loď 🚀!
Jeden ředitel, sedm manažerů, 21 zaměstnanců. Všichni v organizaci jsou řídícími agenty, ale tito agenti odrážejí jejich senioritu. Ředitel řídí náčelníka štábu AI, manažeři jsou hráči-trenéři, kteří sami plní cíle a zároveň školí/koučují ostatní, jak úspěšně manipulovat s AI, což zkracuje rozpětí kontroly na polovinu.
Tato konfigurace snižuje počet zaměstnanců (1:7:49 -> 1:7:14) o 53 %.
Budoucnost není univerzální pro všechny.
Zde je háček: ne každé oddělení ve společnosti přijme stejnou organizační strukturu. Dopad umělé inteligence se dramaticky liší podle funkce, což vytváří svět, kde se podoba společnosti stává nuancovanější než kdy jindy.
Prodejní týmy budou pravděpodobně udržovat tradiční pyramidy nebo raketové lodě. Vztahy pohánějí příjmy a lidská empatie, kreativita a vyjednávací schopnosti zůstávají nenahraditelné. Klasické rozpětí řídicích modelů stále platí, když je prvořadá důvěra a vztah.
Výzkumné a vývojové týmy představují největší příležitost pro transformaci krátké pyramidy. Generování kódu je prvním skutečným přizpůsobením produktu umělé inteligence trhu a generuje 50–80 % kódu pro přední společnosti.
Úspěch a podpora zákazníků se mohou vyvinout v hybridní modely: AI zpracovává rutinní dotazy, zatímco lidé řídí složité eskalace a strategické účty. Tradiční vrstva středního managementu se transformuje do něčeho zcela nového.
Tento vývoj zpochybňuje vše, co víme o efektivním škálování týmů. Stará moudrost 6-7 přímých podřízených se rozpadá, když manažeři dohlížejí jak na lidské podřízené, tak na agenty umělé inteligence.
Transformuje se i náborové břemeno, které historicky ospravedlňovala manažerské hierarchie. Namísto hledání a rozvoje lidských talentů se manažeři stále více zaměřují na konfiguraci schopností umělé inteligence a optimalizaci spolupráce mezi člověkem a umělou inteligencí.
Pokud společnost dodává své organizační schéma, jaké organizační schéma si představujete pro svůj tým?



974
Jeden bilion tokenů denně. Je to hodně?
"A když se podíváme úzce na počet tokenů obsluhovaných rozhraními API Foundry, v tomto čtvrtletí jsme zpracovali více než 100 tun tokenů, což je meziročně 5x více, včetně rekordních 50 t tokenů jen minulý měsíc."
V dubnu společnost Microsoft sdílela statistiku, která odhalila, že jejich produkt Foundry zpracovává přibližně 1,7 tuny tokenů měsíčně.
Včera Vipul sdílel, že zpracovává 2 t open-source inference denně.
V červenci Google oznámil ohromující číslo:
"Na I/O v květnu jsme oznámili, že jsme zpracovali 480 bilionů tokenů měsíčně na našich plochách. Od té doby jsme toto číslo zdvojnásobili a nyní zpracováváme více než 980 bilionů tokenů měsíčně, což je pozoruhodný nárůst."
Google zpracuje 32,7 tuny denně, což je 16x více než Together a 574x více než v dubnovém objemu Microsoft Foundry.
Z těchto čísel můžeme vyvodit několik hypotéz:
1. Odvození z otevřeného zdroje je jednociferný zlomek odvození. Není jasné, jaká část odvozovacích tokenů společnosti Google pochází z jejich modelů s otevřeným zdrojovým kódem, jako je Gemma. Pokud však předpokládáme, že Anthropic & OpenAI jsou 5t-10t tokenů denně a všechny jsou uzavřené, plus Azure je zhruba podobně velký, pak je open-source inference pravděpodobně kolem 1-3% celkové inference.
2. Agenti přicházejí brzy. Z údajů společnosti Microsoft vyplývá, že agenti v rámci GitHubu, Visual Studia, Copilot Studia a Microsoft Fabric přispívají k celkové inferenci AI v Azure méně než 1 %.
3. Vzhledem k tomu, že se očekává, že společnost Microsoft letos investuje 80 miliard dolarů ve srovnání s 85 miliardami dolarů společnosti Google do infrastruktury datových center s umělou inteligencí, měla by se pracovní zátěž každé společnosti v oblasti odvozování umělé inteligence výrazně zvýšit jak díky přechodu hardwaru na internet, tak díky vylepšením algoritmů.
"Jen díky optimalizaci softwaru dodáváme pro stejný GPU o 90 % více tokenů ve srovnání se situací před rokem."
Microsoft vymačkává ze svých GPU více digitální limonády a Google musí také dělat totéž.
Kdy uvidíme zpracování prvních 10t nebo 50t AI tokenů denně? Teď už to nemůže být daleko.
- Odhady z ničeho!
- Google & Azure po 33t tokenech za den, Together & 5 dalších neocloudů po zhruba 2t tokenech za den, & Anthropic & OpenAI při 5t tokenech za den, nám dává 88t tokenů za den. Pokud předpokládáme, že 5 % tokenů Google pochází z modelů s otevřeným zdrojovým kódem, je to 1,65 tuny tokenů denně, což je zhruba 1,9 % z celkové inference. Opět velmi hrubá matematika


877
Top
Hodnocení
Oblíbené