irobot 发表于 2016-12-8 03:24:45

谷歌发布DeepMind实验室:搭建AI三维虚拟平台

谷歌发布DeepMind实验室:搭建AI三维虚拟平台
2016-12-06
  12月5日,DeepMind发布了一个全新的三维(3D)强化学习虚拟平台,帮助研究人员更好的进行实验及进行任意所需的修改,有望推进机器人技术的进步。  谷歌DeepMind是Alphabet公司下属的子公司,主要专注于推进通用人工智能领域的发展。OpenAI是一个非营利人工智能研究组织,致力于推进友好型人工智能发展的基础研究及其信息公开。  这个新的三维平台称为DeepMind Lab,类似于一个封闭的三维“第一人称射击游戏”。 在这个三维虚拟世界中,AI智能体(AI Agent)采用浮动球体的形式,并能感知其周围环境、四处移动和执行简单的动作。智能体能够通过机器学习的形式进行训练并接受积极奖励,最终能够执行各种任务。目前与该平台集成的简单示例任务包括导航迷宫、收集水果以及穿过狭窄通道并保持不摔落。  DeepMind首席科学家兼联合创始人肖恩·莱格(Shane Legg)说:“我们正在努力开发AI智能体,使其能从对环境的观察中进行学习和训练,最终能执行各种任务。”  DeepMind的AI智能体开发早已占据各大传媒头条,例如,创建了能够通过试错法学习如何玩Atari视频游戏(如,“太空侵略者”)的智能体。  DeepMind实验室是一个开放、可定制的三维虚拟世界,将为AI智能体提供更加复杂以及视觉更丰富的挑战,这也意味着更多、更广泛的潜在任务。DeepMind实验室引导AI算法将其从一个任务中的学习经验转移到下一个任务。  莱格称,开发三维环境中的AI智能体也将有利于开发AI算法来控制现实世界中工作的系统,例如工业机器人等。  此外,开发AI智能体并使其根据基本原理来学习一个模拟世界,同时将逐步深入到了解人类如何学习的核心概念。莱格称:“就像你或我作为孩子了解这个世界,对于学习及通用性问题,这是一个非常基本的方法。”  其他人工智能专家也对DeepMind实验室的推出表示出欣喜。  OpenAI创始人兼研究总监伊利亚·苏特斯科夫(lya Sutskever)说,“DeepMind正在发布更多的智能强化环境。AI智能体接触的环境强化学习越多,人工智能领域将进步的越快。”  英国剑桥大学教授Zoubin说:“DeepMind实验室及其他强化学习平台通过让研究人员相互测试彼此的想法,从而使研究进展更加透明公开化。”  然而,葛拉曼尼还指出,现有的强化方法并不总是能很好地达到人的能力。例如,通常人类用户只需很少的播放时间就能掌握特定的视频游戏或棋盘游戏。强化学习方法的数据效率非常低,所以,如何让系统以与人类相当的速度来学习呢?


页: [1]
查看完整版本: 谷歌发布DeepMind实验室:搭建AI三维虚拟平台