Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Em um artigo conjunto com @OwainEvans_UK como parte do Anthropic Fellows Program, estudamos um fenômeno surpreendente: a aprendizagem subliminar.
Os modelos de linguagem podem transmitir seus traços para outros modelos, mesmo no que parece ser dados sem sentido.

23/07/2025
New paper & surprising result.
LLMs transmit traits to other models via hidden signals in data.
Datasets consisting only of 3-digit numbers can transmit a love for owls, or evil tendencies. 🧵

A aprendizagem subliminar pode ocorrer para traços benignos (como gostar de águias) ou traços mais preocupantes (como desalinhamento). Isso tem consequências para o treinamento em dados gerados por modelos.
Leia mais no nosso blog de Ciência do Alinhamento:

443
Top
Classificação
Favoritos