Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dustin Tran
Científico investigador en Google DeepMind. Trabajo en Gemini.
Dejé Google DeepMind después de 8 años. Tantos buenos recuerdos, desde los primeros artículos fundacionales en Google Brain (con @noamshazeer @ashvaswani @lukaszkaiser en Image Transformer, Tensor2Tensor, Mesh TensorFlow) hasta liderar las evaluaciones posteriores al entrenamiento de Gemini para ponerse al día y lanzarse en 100 días, luego liderar al equipo para saltar a LMArena # 1 (¡y permanecer allí durante más de un año!), y finalmente trabajar en las increíbles innovaciones de razonamiento para las medallas de oro IMO e ICPC de Gemini (con @HengTze @quocleix).
Gemini ha sido un viaje salvaje de un paradigma a otro: primero, renovar nuestro modelo LaMDA (¡el primer chatbot similar a una instrucción!) de un chatbot real a respuestas largas y llenas de contenido con RLHF; Luego, el razonamiento y el pensamiento profundo mediante el entrenamiento en largas cadenas de pensamiento, entornos novedosos y cabezas de recompensa. Cuando comenzamos, el sentimiento público era malo. Todos pensaron que Google estaba condenado al fracaso debido a su legado de búsqueda y política organizacional. Ahora, Gemini es consistentemente # 1 en preferencia de usuario y encabeza nuevos logros científicos, y todos piensan que la victoria de Google es obvia. 😂 (También solía ser el caso de que OpenAI saltaba el ciclo de noticias de IA al anunciar ante nosotros una acumulación de ideas para cada nueva versión de Google; es seguro decir que la acumulación está vacía).
Desde entonces me uní a xAI. La receta es bien conocida. Computación, datos y O(100) personas brillantes y trabajadoras son todo lo que se necesita para obtener un LLM de nivel de frontera. xAI *realmente* cree en esto. Para la computación, incluso en Google nunca he experimentado este # de chips per cápita (y 100K + GB200 / 300K están llegando con Colossus 2). Para los datos, Grok 4 hizo la mayor apuesta en escalar RL y postentrenamiento. xAI está haciendo nuevas apuestas para escalar los datos, el pensamiento profundo y la receta de entrenamiento. Y el equipo es rápido. Ninguna empresa ha llegado a donde está xAI hoy en capacidades de IA en tan poco tiempo. Como dice @elonmusk, los derivados de primer y segundo orden de una empresa son los más importantes: la aceleración de xAI es la más alta.
Me complace anunciar que en mis primeras semanas, lanzamos Grok 4 Fast. Grok 4 es un modelo de razonamiento increíble, que sigue siendo el mejor en ARC-AGI y nuevos puntos de referencia como FinSearchComp. Pero es lento y nunca fue realmente dirigido a las necesidades de los usuarios de uso general. Grok 4 Fast es el mejor modelo de clase mini: en LMArena, es el # 8 (¡Gemini 2.5 Flash es el # 18!), Y en evaluaciones de razonamiento central como AIME, está a la par con Grok 4 y es 15 veces más barato. S / o a @LiTianleli @jinyilll @ag_i_2211 @s_tworkowski @keirp1 @yuhu_ai_
3.34K
Populares
Ranking
Favoritas