アメリカの研究チームがマウス実験を通じて、報酬の大きさが学習効率に大きく影響することを明らかにした。
アメリカのハワード・ヒューズ医学研究所(HHMI)ジャネリア・リサーチ・キャンパスの研究チームは、マウス実験により報酬の大きさが学習効率を決定づけることを発見した。

研究チームは、特定の課題に初めて取り組むマウスを二つのグループに分けて実験を行った。片方のグループには少量の水を頻繁に与え、もう一方には多量の水を少ない回数で与えた。
これは人間にお菓子を1つ与えるのと袋まるごとを与えるのとの違いに似ている。
その結果、顕著な差が確認された。大きな報酬を受けたマウスは課題を著しく速く習得した。通常、数千回の小さな報酬を受けながら数日かけて習得する課題を、10回未満の成功で一日で完了した。
学習速度のばらつきも大幅に縮まった。小さな報酬グループが一週間から一ヶ月かかったのに対し、大きな報酬グループはほとんどが数日で課題をマスターした。
研究チームは、この現象の鍵を握るのがドーパミンだと分析している。学習と動機付けを調整する神経伝達物質であるドーパミンの活動を観察した結果、報酬が大きいほどドーパミンの分泌量が増加するだけでなく、持続時間も長くなることが判明した。
研究チームは、より大きな報酬がより長く持続するドーパミン信号を生み出し、この持続的な信号が学習速度向上の原動力になると説明した。
この発見は神経科学界の長年の通説に挑戦するものだ。これまで科学者らは「動物は数百回の反復訓練と小さな報酬を通じて徐々に学習する」と考えてきた。
しかし今回の研究は、「多く繰り返すほどよく学ぶ」という反復を重ねる従来型の学習よりも、「達成時にどれだけ大きな報酬を得るか」が学習効率の鍵となる可能性を示唆している。
共同責任者のルーク・コッディントン主任研究員は、研究結果を教室の状況に例えて説明した。
コッディントン氏は、報酬の大きさを大幅に増やせば、教室内のすべての生徒のドーパミンレベルも上昇し、全員が熱心に授業に参加するようになると述べた。
一方、研究チームは、この研究の限界も認めている。今回の実験がマウスを対象としたものであるため、人間の学習過程でも同様の効果が見られるかどうかは、さらなる研究が必要だとしている。
この研究結果は「報酬の大きさが強化学習の効率を左右する(Reward magnitude determines reinforcement learning efficiency)」というタイトルで、5月22日に国際学術誌『サイエンス(Science)』に掲載された。















コメント0