谷歌DeepMind: 用大语言模型和奖励函数实现机器人技能合成【双语字幕】

Language to Rewards for Robotic Skill Synthesis
Google DeepMind
简介: 这篇论文介绍了一种利用大型语言模型 (LLM) 和奖励函数来优化机器人控制的新方法。通过利用 LLM 定义奖励参数，可以完成各种机器人任务，并实现交互式行为创建体验。该方法在模拟四足机器人和灵巧机械手机器人上的 17 个任务中表现出色，可靠性高达 90%。此外，在真实机器人手臂上进行的实验也验证了该方法的有效性。

论文传送门: https://arxiv.org/pdf/2306.08647.pdf
项目: https://language-to-reward.github.io/

前往BILIBILI(B站)播放

来自:113.116.180.13
时间：2023-08-03 10:37:18
网址：https://www.bilibili.com/video/BV13k4y157vT

谷歌DeepMind: 用大语言模型和奖励函数实现机器人技能合成 【双语字幕】

谷歌DeepMind: 用大语言模型和奖励函数实现机器人技能合成【双语字幕】