Kiani & Shadlen (2009)

2009.05.09(Sat)

Science. 2009 May 8;324(5928):759-64.
Representation of confidence associated with a decision by neurons in the parietal cortex.
Kiani R, Shadlen MN.

4月入ってから異常に忙しく、気付いたら1ヶ月以上も放置してしまいました。
「今週の論文」と呼ばれていたころが懐かしい(笑)

さて、完全な筆不精っぷりを発揮してしまったわたしですが、本論文がそんなわたしをみごとに奮起させてくれました。
Shadlenのグループの最新作です。

これまで彼らのグループでは、ランダムドットモーションを用いた意思決定研究を行なってきたわけですが。
Newsome-Shadlenモデルが成功をおさめた今、彼らが新しく目を付けたのがconfidence
すなわち選択に対する「自信」、裏を返せば意思決定の「不確実性」の認知の神経基盤です。
昨年のSfNでpreliminaryな発表をしていたのは知っていたのですが、ついに結果が出てきました。
これはわたしの関心的にも、業界のトレンド的にも、また研究室の志向としてもマストリードということで、紹介させていただきます。


課題はShadlenの「いつもの」ランダムドットモーション(random dot motion,RDM)課題
試行が開始すると、画面中央に、ランダムに動くたくさんの点が表示される。
これらの点はランダムに微動するが、試行ごとに決まった一定の割合のドットが、試行ごとに決まった特定の方向に向かって同期して動く。
サルはRDMをみて、そのなかからこの同期した運動を見極め、その方向に眼球運動しなければならない。
選択肢となる視覚ターゲットは、記録中のニューロンのRF(receptive field,受容野)内に1つ(Tin)と、それとちょうど中心点をはさんで点対称の位置に1つ(Topp)の計2つ。

ドットの同期率には0%~約50%までがあり、同期率が低いほどサルにとっては難しい試行になる。
また今回の実験では、一定時間RDMが呈示され、そのあとのGoシグナル(中央注視点の消滅)で同期方向を答える。
よってRDMの呈示時間を試行ごとに変化させることで(100ms~900ms)、やはりサルにとっての難易度を変化させることができる。
(RDM課題には、同期運動方向を見極めたらすぐに反応していいRTバージョンもある。)

このRDM課題をもちいて、これまで多くの研究が行なわれた。
もっとも重要なのは、後頭頂皮質のLIPが、眼球運動方向を選択するための外刺激情報(RDM)の収集に重要な役割をするということ。
すなわちLIPの視野位置選択性ニューロンの活動がRDMの刺激持続とともに変化し、ある一定のレベルに達すると意思決定がなされる。
モデルのことばにすれば、
・LIPは意思決定のための情報(意思決定変量,decision variable)を蓄積(accumulation)し、
・それが一定の基準(閾値,decision bound)まで溜まったら、
・下流のFEFや上丘を介して眼球運動がなされる(意思決定)
というもの
これがここ最近(というか長年)のShadlenのグループの研究だった。
(どちらかというと「LIPのニューロンの発火頻度が、個体が意思決定を行なうための意思決定変量として機能している」っていったほうがしっくりくる。)
(「LIPが意思決定変量を蓄積し」っていうと、「なんだそりゃ」みたいなカンジになるし。)

このbouded accumulation modelは大成功をおさめたが、そのおかげで最近は、RDM課題を用いた単純な「意思決定」の実験ではあんまり面白みがなくなってきた。
そこで彼らが目をつけたのが、意思決定における確信度(confidence)
この神経基盤を調べるため、今回のRDM課題には、これまでなかった要素が追加されている。
それがpostdecision wager

RDM呈示が終わった後、中央注視点が消えたらサルは2つの選択肢のうちどちらかに眼球運動するわけだけど。
その際、半分の試行ではTsと呼ばれる第3のターゲットが呈示される。
このTsが呈示された場合、サルはTinやToppでなくTsを選ぶことで、試行を回避することができる。
回避すると、ちゃんとTin・Toppを選んで正解したときより少ないけど、確実に報酬をもらえる。
だからサルとしては、RDMの同期運動方向を分かった自信があるときには、Tsを選ばずに正解を狙いにいったほうが得
だけど自信がなければ、テキトーに選んで間違うよりも、Tsで試行を回避して、ちょっとだけど報酬をもらったほうがいい、というワケ

このように「眼球運動のGoシグナル直前に、試行を回避するためのTsが呈示さる」というのが、本研究のミソ
Tin・Toppと同時にTsが呈示されるんだから、"*POST*decision"という呼び方はちょっと変に感じるが。
まあ「どっちを選択しようかな」の選択はTsの呈示前に終わってて、そのあとで
「実は回避もできますけど、どーします?」
的なカンジでTsという選択肢が呈示されると考えれば、"postdecision wager"になるワケよね。


で、結果。
まず驚くべきは、行動データが非常にきれいに出ていること。
サルがちゃんと確信度をもとにTsを選んでるという指標は
・難しい試行ほど回避率(Ts選択率)が高い
・「Tsが出てるのにわざわざテストを受けた試行」は「Tsが出なかったからしょうがなく受けた試行」より正答率高
などがあるが、それがどっちもきれいに出ている。
すなわちサルの行動データは、
・RDMの同期率が小さいほど、またその呈示時間が短いほど、回避率が高い
・Tsを選ばずにテストを受けた試行は、Tsがそもそも出なくてテストを受けた試行よりも正答率が高い
というようになっていた。(Fig.1)
すごい、キレイすぐる。

んで続いて神経活動データ
こっちもかなりすごい。
記録したのはLIPのニューロン70個
LIPニューロンでは、普通のRDM課題において、RF方向のターゲット(Tin)を示唆するRDMをみてるあいだには活動の経時的上昇がみられる。
逆にRDMがRFと反対方向のターゲット(Topp)を「指し示して」いるときには、そのような活動の上昇はみられない。
では本実験の回避選択肢(Ts)のときはどうだったかというと、TinとToppのときの活動の中間程度になった。
正確には、「RDM呈示開始後の活動増加の立ち上がりかた」も「プラトーに至ったときの発火頻度の絶対値」も、ともにTinを選んだときとToppを選んだときの中間。(Fig.2)

注意しなければならないのは、ここでみている「Tsのときの発火頻度」は、「最終的にTsを選んだ試行の平均」という意味だということ。
というのも本実験では、RDM呈示中にはTsは呈示されておらず、その時点でサルは、その試行でTsが選択可能かどうかまだ知らない。
よって
Tsを選んだ試行では発火頻度(の増加)が、TinのときとToppのときの中間程度
ということの因果的解釈は、
Tsを選んだから、発火頻度が中程度に収まった
のではなくて、
発火頻度が中程度のときに、サルは(もし与えられれば)Tsを選ぶことが多かった
ということになる。

このことは、これまでRDM課題で示唆されてきたbounded accumulation modelでのLIPニューロン活動の意味づけと一致する。
というのもLIPニューロンはこのモデルにおいて、
「そのニューロンのRFに向かって眼球運動をする」という意思決定のための、情報を蓄積する
という役割を与えられてきた。
ということは、あるLIPニューロンに関して、そいつがめちゃめちゃ活動していたら、個体はそのニューロンのRF方向に眼球運動すればよいということがわかる。
逆にそのニューロンがぜんぜん活動していなかったら、そのニューロンのRFには眼球運動すべきでないという情報にもなる。
しかし中程度の活動だった場合には、個体にとって、それはconflictingな情報となる。
そういうときこそどうなるかって…選択を保留(回避)する、ってコトになるよね。

そう考えると、LIPニューロンの活動がちょうど中間(全条件混ぜこぜの平均)程度のときが、個体にとってどちらに眼球運動すればよいのかが分からず、いちばんTsを選びやすいはず。
ということで「RDM呈示後の発火頻度増加率」と「選択直前の発火頻度の絶対値」の2種類を説明変数に、
全体での平均値からの、各試行でのこれらの値のズレ(偏差)
によって、個体のTs選択を予測する回帰分析を行なった。
その結果、いずれの変数に関しても、サルのTs選択率に関して有意な負の回帰を得た。
すなわちサルは、上記2種類の変量の値が「中程度であればあるほど(全体の平均に近いほど)、Ts選択を多く行なった」(Fig.3)
これもニューラルアクティビティと行動を直感的な方法で結び付けていて、すごくエレガント。

あとはお得意のbounded accumulation modelによるパラメータ推定と、モデルからの予測を行なっている。
こちらからも、サルのTs選択率やそのときのLIP活動に関して、実データに近い予測を得た。(Fig.4)
また今回の結果が、「(まだ呈示されていない)Tsに対して注意が向いていたことの結果ではない」ということを示すため、RFの位置にTsをもってくるという条件で、さらに19個の細胞から記録している。
その結果、最終的にTsを選んだ試行と選ばなかった試行では、Ts呈示前には発火頻度に差がないことが明らかになった。(Fig.5)
よってサルがTs呈示前から、Tsが「そのうち出るだろう位置」に注意を向けているということは、なかったと考えられる。


さて、感想だけど。
素直にすごい。
なんとなくマンネリ感のあった…とまでは言わないが、それ単体ではあまり新しさがなくなってきていたRDM課題にほんの少しの変更を加え、非常に面白い方向に発展させたと思う。
またその結果も、これまでのRDM課題を用いた意思決定研究の流れとマッチしていて、とても分かりやすい。
やはり被験者にとっての意思決定の手がかりの強度を、実験者が定量的に変化させられるというところが、この課題の強力なところなのだなぁとつくづく感心させられる。

まあ一応ちょっとは気になった点も書いておくと。
まずFig.4のD~Fのモデルとのフィットは、ホントにフィットしてるのかどうかちょっと分からない。
フィットしてると思ってみればそうみえるけど、意外にずれてるといえないこともない。
それから試行ごとでの解析をするにしては、試行数が多すぎではないだろうか。
p value<10-8とかいう値がばんばん出てくると、ちょっと「数の暴力」的な効果を疑ってしまう。

ともあれ、そこはShadlen
RDM課題のパワーを再認識させられた。
それにしても行動データが非常にきれいに出ているけど、これはホントにすごいな。
ウチの研究室でもメタ記憶の神経基盤の研究ということで、「回避選択肢」を含む記憶課題をサルにやらせてるんだけど。
そもそも課題の段階で、回避ばっかするようになったり、逆に回避をほとんどしなくなったり、問題が絶えないのに。
こんなにキレイに出るとは…
Shadlenのところのサルも、Hamptonのサルみたいに天賦の才をお持ちのひとなのかな…