Koala OSS Club


slime | LLM RL 训练框架


智谱 AI 开源了 Slime,这是支撑 GLM-4.5 和 GLM-4.6 的强化学习训练框架。它通过连接 Megatron 和 SGLang 实现高性能训练,并提供灵活的数据生成接口。除了智谱自家模型,也支持 Qwen、DeepSeek、Llama 系列。 点评:大模型训练框架的开源对行业是好事,能降低后训练的技术门槛。不过这类框架的使用门槛仍然不低,更适合有 GPU 集群和训练经验的专业模型团队。