(原标题:外媒:谷歌教人工智能“做梦” 加快学习过程)
新华社北京11月21日新媒体专电;外媒称,为了加快和简化学习过程,谷歌旗下“深层思维”公司(DeepMind)的团队现在教会了它的人工智能系统像动物一样做梦。
据英国《每日邮报》网站11月18日报道,谷歌旗下的人工智能(AI)系统在雅达利(Atari)游戏中获得了创纪录的高分,还在围棋上击败了人类——不过为了做到这一点,这套系统需要长时间的持续训练。
为了加快和简化学习过程,谷歌旗下“深层思维”公司(DeepMind)的团队现在教会了它的人工智能系统像动物一样做梦。
在重温包含奖励事件的游戏步骤后,人工智能系统能够以10倍于之前算法的速度学会完成这几关游戏。
据至顶网报道,“深层思维”公司在测试后发现,它旗下名为“无监督强化和辅助学习智能体”(Unreal)的系统在游戏中取得的成绩能够达到顶尖人类玩家的87%。
研究人员说,由于现在不必花那么多时间来训练Unreal,他们可以继续做更多自己的实验。
Unreal所做的在迷宫中收集苹果的“梦”是虚拟游戏《Labyrinth》的要点,其形式与热门视频游戏《Quake》类似。
在游戏中,机器需要迅速走出一个蜿蜒曲折的迷宫,沿途每收集到一个苹果都能得分。
研究人员选择这款游戏是因为它能够通过得分强化正确的行为,而且Unreal系统每次只了解迷宫的一部分——这使得研究人员能够监控它学习其余部分的速度。
“深层思维”公司研究人员近日发表了一篇题为《使用无监督辅助任务的强化学习》的论文,强调了“做梦”技巧能够提升人工智能系统的学习速度和最终成绩。
为了做到这一点,“深层思维”公司团队给Unreal系统增加了两项主要的额外任务——其中一项模拟了婴儿发展动作技能的方式,另一项则类似于动物的做梦方式。
他们在论文中写道:“就像动物会更加频繁地梦到正面(或负面)奖励事件一样,我们的智能体会优先重温那些包含奖励事件的场景。”
“深层思维”公司团队在一篇博客文章中解释说,第一项任务教会了人工智能系统如何控制屏幕上的像素,其“重点是学习它的行为会如何影响它将要看到的东西,而不仅仅是预测”。
他们说:“这类似于婴儿通过移动手和观察手的运动来学习如何控制他们的手。通过学习如何改变屏幕的不同部分,我们的智能体学习了视觉输入的特征,这有助于玩游戏和得到更高的分数。”
第二项任务教会了Unreal重点关注它在前几轮游戏中所看到的视觉特征,从而找到捷径。
“深层思维”公司团队解释说:“智能体被训练从近期战况中预测即将出现的奖励。为了更好地应对奖励极少的场景,我们向智能体等比例地输入了有奖励和无奖励的历史数据。通过更多地学习有奖励的历史数据,智能体能更快发现预示着奖励的视觉特征。”
“深层思维”公司团队说,他们的“主要任务”是让人工智能“学会在不用人教的情况下解决复杂问题”。
(原标题:外媒:谷歌教人工智能“做梦” 加快学习过程)