Koala OSS Club


RT-2 | 视觉-语言-动作模型


Google Deepmind 新推出的“视觉-语⾔-动作”模型 RT-2 使机器⼈不仅能够理解⼈类指令,还能将其转换为⾏动。