Jak @cline doświadczył "gorzkości lekcji" w swojej własnej podróży. Kiedy Sonnet 4 został wydany, wiele rzeczy się zepsuło. Model działał w pętlach. Brał instrukcje zbyt dosłownie i robił dziwne rzeczy. Byliśmy zdezorientowani. Ta sama komenda systemowa działała dla 3.5, 3.7, wszystkiego przedtem. W tym momencie zdaliśmy sobie sprawę: nasza komenda sensorycznie przeciążała model. Wszystkie te starannie napisane instrukcje? Przeszkadzały w tym, jak model naprawdę myśli. Gorzka lekcja dla agentów: Myślisz, że możesz dostosować komendy i poprawić modele. I może to działa... na razie. Ale przy większej mocy obliczeniowej modele po prostu stają się lepsze same z siebie. A im więcej pomocy dajesz, tym bardziej tak naprawdę przeszkadzasz. Najlepsza komenda systemowa to ta, która wskazuje agentom właściwy kierunek, a potem ustępuje modelowi.