重要原因:《我的世界》可能听起来不像是支持高级AI研究的重要工具。毕竟,教机器玩一款十多年前发布的沙盒游戏有什么重要的呢?基于OpenAI最近的努力,一个训练有素的Minecraft机器人与AI进步的相关性比大多数人可能意识到的要大。
OpenAI一直专注于造福人类的人工智能(AI)和机器学习进展。最近丝瓜草莓榴莲香蕉芭乐小猪绿巨人,该公司利用超过7万小时的游戏视频成功地训练了一个机器人玩《我的世界》。这一成就远不只是一个机器人在玩游戏。它标志着利用观察和模仿的先进机器学习向前迈出了一大步。
404黄台软件APP免费下载网站OpenAI的机器人是模仿学习(也被称为“监督学习”)的一个很好的例子。与强化学习不同,模仿学习通过观察人类完成特定任务,训练神经网络执行特定任务。强化学习是指学习主体通过尝试和错误达到目标后获得奖励。在这种情况下,OpenAI利用可用的游戏玩法视频和教程教他们的机器人执行复杂的游戏内序列,这需要典型的玩家大约24000个单独的动作才能实现。
模仿学习需要对视频输入进行标记,以提供动作的背景和观察到的结果。不幸的是,这种方法可能是高度劳动密集型的,导致可用的数据集有限。可用数据集的短缺最终限制了代理通过观察学习的能力。
在线无限看免费丝瓜苏州晶体公司OpenAI的研究团队使用了一种被称为视频预训练(Video Pre-Training, VPT)的特定方法,而不是通过大量的手动数据标记操作,来显著增加可用的标记视频数量。研究人员最初捕获了2000小5g影院天天5g多人运动时的《我的世界》注释玩法,并用它来训练一个代理,使其将特定的动作与特定的屏幕结果联系起来。然后,生成的模型被用来自动生成标签的7万小时之前没有标签的Minecraft内容,随时可以在网上获得,为Minecraft机器人提供了一个更大的数据集来审查和模仿。
整个练习证明了可用的视频库(如YouTube)作为人工智能培训资源的潜在价值。机器学习科学家可以使用可用的和适当标记的视频来训练人工智能执行特定任务,从简单的网页导航到帮助用户满足现实生活中的物理需求。