更新:2024.12.20 文責:石井宏憲 (関西医科大学)
木を見て森を見ずとは、ものごとの細部に気を取られ過ぎて俯瞰的視点を失ってしまうことです。ボーナスが貰えるからと資格の勉強を頑張っていたけれど、実は転職した方がもっと給料が上がる、というのは下世話な例でしょうか。もちろん転職のことばかり考えて日々の仕事を疎かにしていては、実力は身につきません。難しいのは、木と森は顕微鏡のフォーカスと同じで、両方同時に焦点を合わせることはできない点です。さて、脳はどのように森と木を見定め、適切な行動選択を行っているのでしょうか。
今回は私が過去に携わった研究の未発表データをご紹介します。未発表データといっても、実は実験自体は結構昔に行われたものです。研究の世界では、別の知見を加えた上でもっと新しい説を提唱するなどのために、実験データを寝かせて熟成させることがしばしばあります。そうしてうっかり熟成させ過ぎて腐ってしまうことも…。とはいえとても面白い神経活動が見られたので供養がてらぜひご一読いただければ幸いです。
この研究で着目したのはドーパミンという神経伝達物質です。ドーパミンは脳内快楽物質として一般の方にもよく知られていますが、実際には多岐にわたる脳機能に関与すると考えられています。例えば側坐核という脳領域(図1)では、行動を起こそうとする時にもドーパミンが放出されます。
図1 中脳ドーパミンニューロンと側坐核の位置
中脳には脳内にドーパミンを放出するニューロンの一群がある。側坐核は中脳ドーパミンニューロンからたくさんのドーパミンを受け取る。
図2はご褒美を得るためにレバー押しをするラットの側坐核におけるドーパミン濃度の変化を示しています。レバーを押す前にドーパミン濃度が上昇しているのが分かります(黒線)。ここで報酬を増やし、引き続きレバー押しをさせて、その際のドーパミンの放出量が回を追ってどのように変化していくかを観察します(色付きの線)。ピンク線は報酬が増えた回のものですが、この時点ではまだペレットを貰っていないので、以前と同じドーパミンの放出パターンとなっています。しかしそれ以降、回を増すごとにレバー押し前のドーパミンの放出量が増大し、また持続する様子が分かります。つまり報酬が増量したことで、ラットがレバー押しに対するモチベーションを高める過程において、側坐核のドーパミン放出量が増加したわけです。側坐核におけるドーパミンの放出量はご褒美の多さ、つまり報酬の価値を反映しているという言い方もできるでしょう。
図2 側坐核ドーパミンの放出量は報酬の価値と密接にリンクする
図3 報酬の相対的価値を逆転させる行動実験
強制選択ではどちらか片方のレバーしか押すことができない。自由選択では好きな方(普通は報酬が多い方)のレバーを押すことができる。強制選択を使って報酬量の違いによってドーパミン放出がどのように変化するかを調べる。自由選択ではラットが本当に報酬量の違いを理解しているのかを確認する。
ここで本題の木と森の話に戻りましょう。木の実を探し回るラットはどの木の下を探すべきかという問題と、そもそも餌場となる森を変えるべきかという問題に直面します。では側坐核におけるドーパミンが伝える報酬の価値は、木と森のどちらを見ているのでしょうか。
この問題を調べるために、相対的価値の逆転課題という行動課題をラットに遂行してもらいました(図3)。課題では得られる報酬量の異なる2つのレバーが与えられます。そして強制選択ではこちらが指定した方のレバーを、自由選択ではラットの好きな方のレバーを押させます。例えば、右レバーを押すと砂糖ペレット4つ、左レバーを押すと2つ得られるとすると、自由選択試行では当然ラットは右レバーを押します。そこで今度は右レバーを押して得られるペレットを1つに減らします。左レバーを押して得られるペレットは一貫して2つですが、その相対的価値は右レバーで4つ得られた前半と1つになった後半で逆転します。この時のドーパミンの放出量の違いを調べるわけですが、ここで強制選択が重要となります。なぜなら自由選択では前半は2つしか得られない左レバーを選ばないため、左レバーを選ぶ時のドーパミンの濃度変化が観察できないからです。
さて、もし側坐核のドーパミンが木を見ていたら、同じ左レバーを押すにしても、相対的価値が低い前半に対して、価値が逆転する後半では放出量が増加すると予想されます。一方で側坐核のドーパミンが森を見ていたら、左レバーを押すとペレットを2つ得られるという関係性は変わっていないので、放出量も変化しないと予想されます。
別の実験では、初めにペレット2つと1つの組合せを試験し、後半にペレット1つを4つに増やす実験も行いました。図2に2つの実験における側坐核ドーパミン濃度変化をそれぞれ逆転前と後、およびそれらを重ね合わせて表示したものを示します。2+、2-はそれぞれ相対的価値が高い・低いことを示します。逆転前だけみると、4と2+におけるドーパミンの放出量が同程度であり、一見ドーパミンが相対的価値を反映しているように見えます。しかし逆転後を見ると、2+は4のレベルよりも低く、逆に2-も1より高い、すなわち4>2+=2->1の関係となっていることが分かります。つまり側坐核のドーパミンは木ではなく森を見ていることが分かったのです。2と1では確かに2が良いが、あくまでももっと良い4があるという情報を側坐核のドーパミンが持つことで、2を得ようとする行動を必要以上に動機づけしないと解釈することができます。
実際の自然界においてはエサは有限であり、採れば採るほどエサは減っていき見つかりにくくなります。エサが見つかりやすいのはどの木の下かはもちろん大事なことですが、最終的にはまさにどんぐりの背比べになるわけです。ある程度のところで見切りをつけて次の餌場に向かう決断が欠かせません。側坐核のドーパミンは森を見ることで、割に合わない行動に対するモチベーションを低下させてドツボにはまってしまうのを回避するのに役立ているのかもしれません。
図4 ドーパミンの放出量は報酬の大きさのモノサシ!?
図の見方は図2と同じ。2-は相対的価値が低い、2+は相対的価値が高いことを示す。相対的価値を逆転させた後半のドーパミン放出パターンを比較した右下の図を見ると2-と2+にほとんど違いがないことが分かる。すなわち側坐核のドーパミン放出量は相対的な価値によって変化するわけではないことが分かる。実験条件2の前半ではまだラットは4が存在することを知らないため、2+に対するドーパミン放出量は実験条件1の4のような高さになっている。しかし逆転後は4に対する放出量がさらに増加することで、4>2+=2->1の大小関係が形作られている。
ところでこの研究は、私がイギリスのオックスフォードという留学していた際にかかわらせていただいたものです。オッスフォードは大学以外何もないド田舎でしたが、コッツウォルズの田園風景と中世の街並みが美しいとても素晴らしいところで、もちろん研究環境にも全くの不満もありませんでしたが、数年の留学生活を経て一点だけ私の中で我慢の限界を迎えていました。それはおおかたの皆さんの予想の通り、食事です。私は毎食コンビニでも気にしない、食に興味のない人間だと自負しており、イギリスでも何の問題もないと思っていました。しかしとんだ井の中の蛙でした。留学当初はまあこんなものかと思っていましたが、食の罠はイギリス社会のあらゆるシーンに幾重の層にもわたって仕込まれており、それがボディーブローのように効いてきくるのです。同僚と行くレストラン、大学のカフェテリア、レトルト食品、あまつさえサンドイッチ。もちろんおいしい店もあるので、友人たちとあの店はどうだ、この店がいいらしいと週末は町中を探し回り、時は郊外まで足を延ばしました。しかし平日はそうもいかないので自炊を頑張るしかない。しかし自炊は一向にそれを改善しませんでした。そしてある時気づいたのです。原因はスーパーで買う食材そもそもの味であるということに。この無慈悲な現実は数年間耐えてきた私の中の糸を遠慮なく断ち切りました。きっとドーパミンがこう囁いたのだと思います。「日本ならコンビニだっておいしかったじゃない!」。かくして私は偉大なる大英帝国に敗れ去り帰国の途についたのでした。(個人の感想ですmm)
とても美しい自然と街並みで、特に初夏のシーズンはおススメです。まるで映画やゲームの世界のようです!
食事も一品一品はとても美味しいことが多いです。私にとっての問題はその味が毎日のように続くということでした。どこまでも茶色。。。