Uma frustração que tive esta semana é que algumas versões do LLM funcionam muito melhor e pior para alguns prompts. Por exemplo, alguns (mesmo na mesma família ou na mesma versão) tiveram consistentemente um erro de análise em coisas que o resto dos LLMs poderiam lidar. Eu estava irritado, mas dei de ombros.
16,24K