slime | LLM RL 训练框架

智谱 AI 开源了 Slime，这是支撑 GLM-4.5 和 GLM-4.6 的强化学习训练框架。它通过连接 Megatron 和 SGLang 实现高性能训练，并提供灵活的数据生成接口。除了智谱自家模型，也支持 Qwen、DeepSeek、Llama 系列。点评：大模型训练框架的开源对行业是好事，能降低后训练的技术门槛。不过这类框架的使用门槛仍然不低，更适合有 GPU 集群和训练经验的专业模型团队。