登录 注册

重要理论更新!DeepMind研究表明,大脑使用与AI类似的分布奖励机制

1951 年,“人工智能之父”Marvin Minsky 借鉴了巴甫洛夫对动物行为的观察结果,开始尝试设计最早的智能机器和神经网络模拟原型。基于动物学习过程中对奖励和惩罚的反应,他创造了一台可以通过不断学习来解决迷宫问题的计算机。

虽然神经科学家当时还没有弄清楚大脑这种学习机制的原理,但 Minsky 仍然能够在一定程度上模仿和复制这种行为,推动了人工智能(AI)的发展。

如今在计算机科学领域,这种机制就是我们熟知的强化学习技术。随着强化学习的不断完善,它反过来可以帮助神经科学家们更深入地了解动物大脑的这种机制,促进了两个领域之间良性循环发展。

《自然》杂志上发表的一篇最新论文中,DeepMind 借鉴了研究强化学习技术得出的经验,提出了一套关于我们大脑内奖励机制的新理论。该假设初步得到了实验结果支持,不仅增进了我们对心理健康和行动动机的理解,还足以证明 AI 研究正朝着通用人工智能技术的方向迈进。

声明:该文观点仅代表作者本人,探趣吧系信息发布平台,探趣吧仅提供信息存储空间服务。
大家都在看
北京各大医院挂号