최근 듀크대학교 연구진이 국제 학술지 Nature에 발표한 연구는 명확한 보상이 없는 학습에도 도파민이 관련되는지에 대한 물음에 중요한 답을 제시했다.
연구팀은 어린 얼룩말핀치(Zebra finch)가 성체의 노래를 모방하고 점점 정교화해 가는 과정을 분석해 외적 보상이 없는 자발적 학습에서도 도파민이 행동의 질을 세밀하게 추적하며, 학습을 유도하는 핵심 신경신호로 작용한다는 사실을 밝혔다. 특히 노래의 각 음절이 얼마나 성숙한지에 따라 도파민 분비량이 실시간으로 달라지는 현상이 확인되었으며, 이는 도파민이 ‘내재적 평가자’로서 기능함을 보여주었다.
노래의 구성 음절들은 시간에 따라 점진적으로 성숙해졌으며, 그 성숙도를 정량화한 지표(Predicted Age, PA)는 실제 생후 일수와 높은 상관을 보였다. 그리고 도파민 신호는 각 노래 음절의 성숙도가 높을 때 유의미하게 증가했으며, 이전보다 더 미숙한 음절을 부를 경우 도파민 방출량이 감소하는 경향을 나타냈다.
공동 저자인 존 피어슨(John Pearson) 듀크대학교 생물정보학과 교수는 “우리는 도파민이 단순히 보상의 존재를 나타내는 것이 아니라, 행동의 질을 실시간으로 추적하는 정교한 신호임을 확인했다”고 밝혔다.
이 연구는 도파민의 역할을 단순한 보상 신호 전달자에서 ‘자발적 학습의 정밀한 조율자’로 재정의하며, 뇌가 어떻게 외적 자극 없이도 행동을 정제하고 학습하는지를 설명하는 데 결정적인 단서를 제공했다.
도파민은 어디서 오는가흥미로운 사실은 도파민 방출이 고전적 도파민 뉴런에서만 기원한 것이 아니라는 점이다.
도파민은 뇌 깊숙한 중뇌의 복측 피개영역(VTA)에서 만들어져 학습이나 동기와 관련된 여러 뇌 부위로 전달된다고 알려져 있다. 그런데 이번 연구는 도파민이 단지 이 고전적인 경로만으로 조절되는 것이 아님을 확인했다. 연구진은 새가 노래를 할 때 노래의 리듬과 구조를 계획하는 전운동 피질 영역인 HVC(high vocal center)의 신호도 도파민 분비를 촉진한다는 사실을 밝혀냈다.
어떻게 이런 일이 가능할까? 그 열쇠는 ‘아세틸콜린’이라는 또 다른 신경전달물질에 있었다.
HVC에서 나온 신호는 기저핵 내에 있는 콜린성 뉴런을 자극해 아세틸콜린을 분비하게 하고, 이 물질이 다시 도파민 말단의 니코틴성 수용체를 자극하여 도파민을 방출시킨다. 즉, HVC → 아세틸콜린 → 도파민이라는 우회 경로가 존재하는 셈이다.
이 경로의 존재는 약물 실험에서도 확인됐다. 아세틸콜린 수용체를 억제하는 약물(DHβE)을 새의 뇌에 투여하자 도파민 방출이 뚜렷하게 줄었고, 노래 학습 능력도 함께 떨어졌다. 이는 도파민이 언제, 얼마나 분비되는지가 아세틸콜린 신호에 의해 조율된다는 결정적 증거다.
도파민과 아세틸콜린의 기능적 분화한편, 도파민과 아세틸콜린는 모두 노래 중 증가하는 신경전달물질이지만, 학습과 관련된 기능은 전혀 다른 것으로 나타났다.
실험에 따르면 도파민은 노래가 얼마나 잘 불렸는지, 즉 음절 하나하나의 '성숙도'와 매우 밀접하게 연결되어 있다. 반면, 아세틸콜린은 단순히 노래를 시작할 때 함께 나오는 배경 신호일 뿐, 노래의 질적 평가에는 반응하지 않는다.
리처드 무니(Richard Mooney) 듀크대학교 신경생물학과 교수는 “도파민이 수행 결과를 민감하게 추적하는 ‘학습 피드백 신호’로 기능하고, 아세틸콜린은 도파민을 조절하는 ‘환경 설정자’ 역할을 한다는 점을 보여준다.”고 말했다. 또한, “노래를 잘 부른다는 것은 단지 근육을 잘 쓰는 것이 아니라 뇌가 그 질을 평가하고 신경회로를 점진적으로 수정한다는 것을 의미한다.”고 덧붙였다.
이번 연구는 인간의 언어 및 음악 학습, 그리고 내재적 동기에 의한 기술 습득 메커니즘을 이해하는 데 중요한 기초를 제공하며, 향후 자율 학습형 인공지능 모델 개발에도 시사점을 줄 수 있을 것으로 예상된다.
김현정 리포터 ㅣ 저작권자 2025-04-03 ⓒ ScienceTimes(
원문출처)