2023年12月13日,哥伦比亚大学等机构的研究人员在Nature杂志在线发表了题为Dynamic behaviour restructuring mediates dopamine-dependent credit assignment的文章。
动物在探索新环境时表现出多种行为方式,并且可以了解哪些动作或动作序列会产生积极的结果。在遇到奖励时释放多巴胺对于加强产生奖励的行为至关重要。然而,理解如何将信用分配给在连续行为期间产生多巴胺释放的确切动作是具有挑战性的。
该研究用一种新的自我刺激范式研究了这个问题,在这种范式中,特定的自发运动触发了多巴胺能神经元的光遗传刺激。多巴胺的自我刺激迅速而动态地改变了整个行为库的结构。最初的刺激不仅增强了产生刺激的目标动作,而且还增强了类似于目标的动作以及在刺激前几秒钟发生的动作。反复配对导致行为曲目逐渐完善,以适应目标。动作序列的强化揭示了细化的进一步时间依赖性。通过长时间间隔自发分离的动作对促进了逐步的信用分配,早期细化了最接近刺激的动作,随后细化了更远端的动作。因此,追溯性强化机制不仅促进强化,而且促进整个行为库的逐步完善,以将信用分配给导致多巴胺释放的特定动作和动作序列。