更新:2026.2.2 文責:長谷川 拓 (国立精神・神経医療研究センター)
ヒトや動物は、必ずしも最適と考えられる行動だけを繰り返すだけではなく、あえて別の行動をとる、いわばアマノジャクな振る舞いを示します。
このような行動は一見無駄に思えますが、強化学習の観点から見ると、探索行動としての重要な意味を持ちます。例えば、現在は最適だと考えられている行動から少し外れた行動を試し、その結果が良ければ行動を切り替える、という過程を繰り返すことで、行動は次第に最適なものへと近づいていきます。
このような強化学習には、脳の大脳皮質の内側に位置する大脳基底核と呼ばれる領域が関与している事が知られています。特に小鳥を用いた一連の研究から、大脳基底核が探索行動の生成や、その結果を将来の行動選択に反映させる役割がある事が分かってきました。
スズメの仲間である鳴禽類のさえずりは、精密な筋制御を必要とする高度な運動学習の代表的な例です(図1)。研究によく用いられるキンカチョウのオスは、幼少期に親鳥のさえずりをテンプレートとして記憶し、それに近づくように自らの発声を試行錯誤しながら調整します。
さえずりには、オスがメスに対する求愛行動として行うDirected songとオスが単独で発声するUndirected songの2種類があります。この二つはソノグラムで比較するとほとんど同じに見えますが、Undirected songでは、さえずり毎に音の高さなどの変動が大きいことが知られています。このような変動は大脳基底核によって生成され、さえずりの学習や維持に重要な役割を果たしていると考えられています。
小鳥のさえずりに関わる神経回路には、主に二つの経路があります。
1.さえずりの生成に直接関与するHVC→RAの経路(図2Aマゼンタ色の矢印)
2.さえずりに変動を導入する、大脳基底核が関与するAnterior Forebrain Pathway(AFP)(図2A緑色の矢印)
AFPは、哺乳類の大脳基底核に相当するArea X、視床に相当するDLM、そして大脳皮質に相当するLMANから構成されています。この回路は、哺乳類における大脳皮質―大脳基底核―視床回路と相同であることが知られています(図2B)。
Undirected songでは、Area X及びLMANにおける神経活動の変動が増大し、それがさえずりの揺らぎとして現れることが示されています (Kao et al., 2008; Woolley et al., 2014)。これは、従来の運動からあえて少し異なる動きを試す、いわばアマノジャク的な探索行動を、大脳基底核が生成していることを示唆します。
特定の音素の基本周波数があらかじめ設定した閾値を超えた場合にのみノイズを提示する聴覚フィードバック実験では、小鳥がノイズを回避するように、その音素の基本周波数を変化させることが報告されています (Tumer & Brainard, 2007)。また、LMANを損傷させるとこの変化が生じないことから、AFPがこの適応的変化に必須であることが示されています。これらの結果は、一見ノイズのように見える行動のばらつきが、さえずりの維持や環境への適応に重要な役割を果たしていることを示しています。
従来、大脳基底核は直接路による運動促進と間接路による運動抑制のバランスで運動を制御すると考えられていました(図3)(DeLong, 1990)。この仮説は発火頻度モデルとも呼ばれ、大脳基底核の出力核である淡蒼球内節 (GPi) の発火頻度が低下すると、脱抑制 (disinhibition) によって視床の活動が促進され、その結果として運動が実行されると説明されます。
しかし、小鳥の大脳基底核に相当するArea Xを損傷させても、そこから入力を受ける視床のDLMにおける神経活動は、さえずりに相関とした活動を示すことが報告されています。この結果から、DLMの活動はArea Xではなく、RAの活動によって主に制御されていることが示されました(Goldberg & Fee, 2012)。
この結果は「視床の活動は大脳基底核によって制御される」という発火頻度モデルの予測と矛盾します。そこで、ヒトに近いマカクザルを用いて、大脳基底核の出力核である淡蒼球内節と、そこから入力を受ける視床のVLa核 (ventrolateral anterior nucleus) から同時に神経活動を記録する研究が行われました (Schwab et al., 2020)。発火頻度モデルでは、運動開始時に淡蒼球内節の活動が低下し、それに伴ってVLa核の活動が上昇すると予想されます。しかし、実際には淡蒼球内節の活動変化はVLa核よりも遅れて生じ、さらに運動中には淡蒼球内節ニューロンの多くが活動低下ではなく、むしろ活動上昇を示しました。
これらの結果は、大脳基底核の役割が、従来考えられてきたような運動の促進と抑制ではなく、別の機能を担っている可能性を示唆しています。さらに、筆者の研究では、マカクザルの大脳基底核の視床下核を抑制すると、出力核である淡蒼球内節の発火頻度は大きく変化しない一方で、発火パターンの変動性が増大し、行動の安定性が低下することを見いだしました (Hasegawa et al., 2022)。これらの研究から、小鳥で示されてきた「大脳基底核が行動の変動性を制御する」という役割が、哺乳類にも共通して存在する可能性があると考えられます。
大脳基底核は、行動にランダム性を導入し、その結果を評価し、良いもののみを選択・保持するといった強化学習の枠組みを実装していると捉えることができます。このように、あえて最適でない行動を試すことは、環境や状況が変化した際にも最適解を見つけ続けるための戦略であると考えられます。時には、一見無駄に思える行動こそが、最適な選択なのかも知れませんね。
参考文献
DeLong, M.R. (1990) Primate models of movement disorders of basal ganglia origin. Trends Neurosci., 13, 281–285.
Goldberg, J.H. & Fee, M.S. (2012) A cortical motor nucleus drives the basal ganglia-recipient thalamus in singing birds. Nat. Neurosci., 15, 620–627.
Hasegawa, T., Chiken, S., Kobayashi, K., & Nambu, A. (2022) Subthalamic nucleus stabilizes movements by reducing neural spike variability in monkey basal ganglia. Nat. Commun., 13, 2233.
Kao, M.H., Wright, B.D., & Doupe, A.J. (2008) Neurons in a Forebrain Nucleus Required for Vocal Plasticity Rapidly Switch between Precise Firing and Variable Bursting Depending on Social Context. J. Neurosci., 28, 13232–13247.
Schwab, B.C., Kase, D., Zimnik, A., Rosenbaum, R., Codianni, M.G., Rubin, J.E., & Turner, R.S. (2020) Neural activity during a simple reaching task in macaques is counter to gating and rebound in basal ganglia-thalamic communication. PLoS Biol., 18, e3000829.
Tumer, E.C. & Brainard, M.S. (2007) Performance variability enables adaptive plasticity of ‘crystallized’ adult birdsong. Nature, 450, 1240–1244.
Woolley, S.C., Rajan, R., Joshua, M., & Doupe, A.J. (2014) Emergence of Context-Dependent Variability across a Basal Ganglia Network. Neuron, 82, 208–223.