Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Qwen
Модели открытых фундаментов для AGI.
LightX2V предоставляет поддержку Day-0 для Qwen-Image-Edit-2511 — сочетая 47% ускорение фреймворка с CFG + 4-ступенчатой дистилляцией (↓25× вычислений) для огромного ускорения 42.55× от начала до конца!⚡️ Огромное спасибо @XHPlus_

Ruihao Gong6 часов назад
🚀 Ускорение 42.55x!
LightX2V предоставляет поддержку Day 0 для @Alibaba_Qwen нового Qwen-Image-Edit-2511!
🔥 Ускорение фреймворка на 47%
⚡️ CFG+4-ступенчатая дистилляция (↓25x вычислений)
📈 Общее ускорение 42.55x
Репозиторий:
Модель:

40
🚀 Представляем Qwen-Image-Edit-2511 — значительное обновление по сравнению с 2509, обеспечивающее значительно более высокую согласованность и более мощное редактирование изображений в реальном времени.
✨ Что нового в 2511:
👥 Более высокая согласованность для групповых фотографий и сложных сцен
🧩 Встроенные популярные LoRAs от сообщества — дополнительная настройка не требуется
💡 Улучшенное создание промышленных и продуктовых дизайнов
🔒 Сниженное смещение изображений с драматически улучшенной согласованностью персонажей и идентичности
📐 Улучшенное геометрическое мышление, включая строительные линии и структурные правки
От редактирования портретов с сохранением идентичности до высококачественного слияния нескольких людей и практических рабочих процессов в инженерии и дизайне, 2511 поднимает редактирование изображений на новый уровень.
👉 Попробуйте сейчас:
🎨 Qwen Chat (Редактирование изображений):

26
Рад сотрудничать с SGLang по поводу Rollout Routing Replay (R3) — теперь в эфире! 🎉

LMSYS Org23 часа назад
SGLang + Miles: Rollout Routing Replay (R3) теперь в эфире! 🎉
Мы рады сообщить, что SGLang и Miles теперь поддерживают Rollout Routing Replay (R3) для стабильного обучения с подкреплением на моделях MoE!
Обучение моделей MoE с использованием RL было известным своей нестабильностью, часто приводя к катастрофическому коллапсу. В чем проблема? Несоответствие маршрутизации между движками вывода и обучения. R3 решает эту проблему, записывая решения экспертов по маршрутизации во время вывода и воспроизводя их во время обучения.
Влияние значительное: значительно снижена разница между обучением и выводом за счет повторного использования решений маршрутизации вывода, предотвращая коллапс обучения. R3 полностью поддерживает распределенное обучение с DataParallel Attention и всеми стратегиями параллелизма, поддерживаемые модели включают Qwen3-30B-A3B, deepseek_v2 и др.
Попробуйте и дайте нам знать о ваших результатах! 🚀

37
Топ
Рейтинг
Избранное
