Koala OSS Club
科技周报
深度分析
俱乐部视频
周边
slime | LLM RL 训练框架
智谱 AI 开源了 Slime,这是支撑 GLM-4.5 和 GLM-4.6 的强化学习训练框架。它通过连接 Megatron 和 SGLang 实现高性能训练,并提供灵活的数据生成接口。除了智谱自家模型,也支持 Qwen、DeepSeek、Llama 系列。 点评:大模型训练框架的开源对行业是好事,能降低后训练的技术门槛。不过这类框架的使用门槛仍然不低,更适合有 GPU 集群和训练经验的专业模型团队。
URL
https://thudm.github.io/slime/
标签
AI,工具
视频
科技周报视频合集