< 返回B站视频无水印解析工具

谷歌DeepMind: 用大语言模型和奖励函数实现机器人技能合成 【双语字幕】

Language to Rewards for Robotic Skill Synthesis
Google DeepMind
简介: 这篇论文介绍了一种利用大型语言模型 (LLM) 和奖励函数来优化机器人控制的新方法。通过利用 LLM 定义奖励参数,可以完成各种机器人任务,并实现交互式行为创建体验。该方法在模拟四足机器人和灵巧机械手机器人上的 17 个任务中表现出色,可靠性高达 90%。此外,在真实机器人手臂上进行的实验也验证了该方法的有效性。

论文传送门: https://arxiv.org/pdf/2306.08647.pdf
项目: https://language-to-reward.github.io/
前往BILIBILI(B站)播放
  • 来自:113.116.180.13
  • 时间:2023-08-03 10:37:18
  • 网址:https://www.bilibili.com/video/BV13k4y157vT