地牢大师
在与角色交谈的同时,在基于文本的冒险游戏中完成任务的人工智能不仅学会了自己行事,而且还迫使他人去做某事。这样的系统是朝着创造可以使用自然语言来实现其目标的机器迈出的一步。
像GPT-3这样的自然语言模型处理算法非常适合模仿人类写的句子,编写故事,伪造博客和帖子。但是,这个富有成果的产品除了创建文本本身外没有其他意义。当人们使用语言时,他们将其用作工具:我们的语言说服,命令和操纵;他们使人们笑和哭。
为了创建有充分理由使用单词的AI,位于亚特兰大的佐治亚理工学院和Facebook AI Research的研究人员将自然语言处理与学习相结合,学习机器学习模型以实现其预期目标。
如何与龙沟通?
研究人员在Facebook去年开发的基于文本的多人游戏LIGHT中训练了他们的系统,该游戏用于研究人与AI玩家之间的交流。游戏在主题幻想世界中进行,其中充满了成千上万个众包对象,人物和位置,这些对象被描述并与屏幕文字互动。玩家(人或计算机)通过选择诸如拥抱向导,杀死巨龙或脱下帽子之类的命令来行动。他们还可以与聊天机器人控制的角色交谈。
这场比赛中的人工智能扮演了龙的角色,它接受了某些任务,例如金的积累。为了成功完成任务,他必须与其他AI代理或真正的游戏玩家进行交流,就像在任何其他基于文本的冒险中一样,只需输入某些命令即可。
结果有点离奇,龙发出无意义的威胁来迫使角色实现其愿望。但是,根据该团队的研究,由于AI开始了解不同真实角色之间的交流的个性特征,因此它仍然实现了其目标。
. , , , , . .
为了向他们的AI解释为什么要做某事,研究人员添加了大约7500个众包任务,而原始版本的LIGHT中没有这些任务。他们还创建了一个知识图谱(主题-关系-对象关系数据库),为AI提供有关游戏世界及其角色之间关系的可靠信息。例如,商人只有在成为朋友时才会信任警卫的原则。该游戏引入了诸如“去山上”和“吃骑士”之类的动作,必须完成这些动作才能完成任务(例如,“建造龙所发现的最大宝藏”)。
综上所述,开发人员训练了AI,只需使用自然语言即可完成任务。要执行任何动作,一个人可以输入适当的命令,或者通过与其他角色交谈来达到相同的结果。例如,如果AI需要一把剑,它可以偷走它或说服另一个角色将它还给他。
一个人(灰色)使用AI(蓝色)执行任务时的对话示例。
当然,今天这个系统只是一个玩具。人工智能与真实玩家交流的方式似乎非常简单:在某个时候,当它需要一个存储桶时,它只是说:“给我这个存储桶,不然我就喂给我的猫!” 但是,将自然语言处理与学习相结合是一个令人兴奋的步骤,不仅可以导致可以争论和说服的更好的聊天机器人,而且可以导致对我们充满语言的世界有更好理解的聊天机器人。
参考文献列表: