僅僅過了2個小時,已經有超過60次零GPU運行了。
AK
AK9月9日 04:17
MiniCPM4.1-8B 具有可訓練稀疏注意力的推理LLM 擁有80億參數,支持融合思維 在anycoder中為其編寫gradio應用程序 線程中的鏈接
17.44K