Je docela šílené, že jsme začali pracovat na MLX ještě před tím, než ChatGPT existoval.
Připadá mi, že je to už dávno, co ChatGPT vyšlo. A to tak krátkou dobu, co jsme stavěli MLX. Těžko se to smíří.
Provoz čtyř vysoce úrovňových OpenCode agentů + subagentů s kontinuálním dávkováním mlx_lm.server a MiniMax M2.5 (6bit).
Snadno se vejde na 512GB M3 Ultra. Generace je poměrně rychlá. Ale předplnění je stále pomalé ve srovnání s cloudovými servery.
Toto jsou dva důležité trendy v AI:
- Vrchol inteligence roste
- Inteligence na watt (IPW) roste
Díky rozšiřování a zmenšování jmenovatele si myslím, že IPW se mění ještě rychleji.
O tom prvním slyším hodně diskuzí, ale o druhém už tolik ne. A fakt, že se to děje současně, ztěžuje předpověď, jak bude AI vypadat za 2–5 let.