MiniCPM4.1-8B 具有可训练稀疏注意力的推理LLM 拥有80亿参数,支持融合思维 在anycoder中为其编写gradio应用程序 线程中的链接
31.57K