为什么你的 LLM 每次运行时的回答都不一样? 即使在 temperature=0 的情况下? 这不是幻觉。这不是浮点混乱。 这是批处理非确定性。🧵 (1/5)