DeepMind开发展示社交学习能力的人工智能
谷歌DeepMind项目的人工智能研究团队开发了一种能够展示社交学习能力的人工智能系统。在《自然通讯》杂志上发表的论文中,该小组描述了他们如何开发一种人工智能应用程序,该应用程序表明它能够通过复制植入的“专家”的动作来在虚拟世界中学习新技能。
大多数人工智能系统(例如ChatGPT)通过接触大量数据(例如来自互联网存储库的数据)来获取知识。但业内人士指出,这种方法效率不高。因此,该领域的许多人继续寻找其他方法来教导人工智能系统学习。
研究人员最常用的方法之一是尝试模仿人类学习的过程。与传统的人工智能应用程序一样,人类通过接触环境中的已知元素并遵循知道自己在做什么的其他人的例子来学习。但与人工智能应用程序不同的是,人类无需大量示例即可识别事物。例如,孩子在观看别人玩几分钟后就可以学会玩杰克游戏——这是文化传播的一个例子。在这项新的努力中,研究团队尝试使用仅限于虚拟世界的人工智能来复制这一过程。
该团队的工作首先是构建一个虚拟世界(称为GoalCycle3D),该世界由不平坦的地形组成,上面有各种障碍物和多种颜色的球体。然后他们添加了人工智能代理,旨在通过避开障碍物并穿过球体来穿越虚拟世界。智能体获得了学习模块,但没有获得有关他们将居住的世界的其他信息。他们获得了如何通过强化学习继续进行的知识。
为了让代理学习,他们获得了奖励,并被允许一遍又一遍地穿越多个类似的虚拟世界。通过这样做,特工能够穿过虚拟世界到达所需的目的地。然后,研究人员在虚拟世界中添加了另一项功能,专家代理已经知道从一个地方到达另一个地方而不会遇到障碍的最佳方式。在新场景中,非专家代理很快了解到,到达所需目的地的最快方法是向专家学习。
在观察智能体的学习过程中,研究人员发现,他们在专家的帮助下做得更快,并且能够通过模仿他们在之前的试验中从专家那里学到的知识,更好地导航其他新的类似虚拟世界。即使在没有专家的情况下,他们也能够应用这些技能(由记忆模块提供)——研究人员声称,这是社会学习的一个例子。