Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Лінійне масштабування досягається за допомогою кількох екземплярів DeepSeek v3.1. 4 комп'ютери Mac = 4x пропускна здатність.
2x M3 Ultra Mac Studios = 1x DeepSeek @ 14 ток/сек
4x M3 Ultra Mac Studios = 2x DeepSeek @ 28 ток/сек
DeepSeek V3.1 є моделлю з параметрами 671B, тому при рідній 8-бітній квантуванні їй потрібно ~700 ГБ пам'яті для роботи моделі. EXO розміщує по половині шарів на кожному пристрої, об'єднуючи їх пам'ять. EXO використовує MLX, розподілений з міжмережевим з'єднанням TB5, оптимізований для Apple Silicon.
Якщо нам потрібна більша пропускна здатність, додавання ще двох пристроїв дозволяє обслуговувати більше користувачів одночасно. @exolabs справляється з усім цим бездоганно - додаючи до кластера більше пристроїв для лінійного масштабування в міру того, як нам це потрібно.
Новий EXO 1.0 скоро буде з відкритим вихідним кодомTM
87,81K
Найкращі
Рейтинг
Вибране