谷歌DeepMind: 用大语言模型和奖励函数实现机器人技能合成 【双语字幕】
Language to Rewards for Robotic Skill Synthesis
Google DeepMind
简介: 这篇论文介绍了一种利用大型语言模型 (LLM) 和奖励函数来优化机器人控制的新方法。通过利用 LLM 定义奖励参数,可以完成各种机器人任务,并实现交互式行为创建体验。该方法在模拟四足机器人和灵巧机械手机器人上的 17 个任务中表现出色,可靠性高达 90%。此外,在真实机器人手臂上进行的实验也验证了该方法的有效性。
论文传送门: https://arxiv.org/pdf/2306.08647.pdf
项目: https://language-to-reward.github.io/