●メモ。『考える脳考えるコンピューター』(ジェフ・ホーキンス)、6章の前半。
●新皮質は特定の仕事をする機能領域に分かれ、各領域は多数の軸索によってつながれている。軸索はその一部が電気パルスによって興奮を伝達する。この興奮の空間的分布と、分布の時間的変化が「パターン」を形成する。
●各領域はそれぞれ層構造をなしており、例えば視覚野は「V1野」「V2野」「V4野」「IT野」の四層になっている。網膜からの情報はまずV1野に送られ、IT野まで順に階層を上って行く。V1野に送られる信号は常に流動的であり、視線を変えるたびに一秒に何度もそのパターンをめまぐるしくがらりと変える(視覚によって「認識」される対象はV1野が見ているものではない)。V1野のニューロンは決まったパターンにだけ反応する。例えばあるニューロンは「30度傾いた線分」にのみ反応する。それが傾いた木の幹でも「M」という文字でも区別はない。角度がかわればすぐに興奮は消える。ところが階層を上ってIT野になるともっと安定し、ある物体が見えている限り興奮を保つニューロンがあらわれる。「顔細胞」は、見えている顔が傾いていても逆さでも部分的に隠れていても、「顔」が視野にある限り興奮を保つ。階層を上って行くにしたがい、頻繁だったニューロンの変化は稀になり、安定し、限られていた対象空間が広がってゆく。
●階層を上って行く感覚→認識の流れだけでなく、層を下って行く逆方向の流れ(記憶→予測)がある。予測と感覚は常に同時にはたらく。認識-予測のためには起きると思ったことと実際に起きたことが比較される必要がある。起こったことが階層を上ってゆき、起きると思うことが下ってゆく。
●一瞬の入力だけでは対象を判断できない。時間とともにつぎづき供給される入力が必要となる。一つの音だけではメロディーを知ることが出来ない。そのため、個々の入力パターン(興奮の空間的配置)が存続するよりも長く興奮がつづくニューロンがなければならない(配置の時間的変化)。階層を上るにしたがってニューロンの変化の頻度が低くなる必要性がここにもある。
●特定の機能をもつ各領域はさらにその上位の「連合野」によって相互につながっている。各領域において、現在の入力(階層の上への流れ)の不足が予測(階層の下への流れ)によって補われるのと同様に、連合野のつながりによって、同じ流れが異なる感覚の間にもまだかって起こる。例えば音によって次の瞬間に見えるはずのものが予測される。つまり「視覚野」という特定の領域は存在するが、あらゆる感覚を含んだ単一のシステムの一部としてあるにすぎない。あらゆる感覚が単一のシステムであるのと同様、感覚と運動も別のものではない。《運動野はほとんど感覚野の一つのように機能する》。感覚野を下向きの流れる「予測」と、運動野を下向きに流れる「運動の命令」は同型である。
●あらゆる感覚の情報はすべて組み合わされ、枝分かれした単一の階層構造のなかを上下する。あらゆる感覚、認識、運動が、新皮質の階層を上下するパターン(感覚と予測)の大規模な協調だけから生み出されている。そして、その「予測」のすべては経験によって学習されたものである。人間は生まれた時には予測を生み出すための何の知識ももたず、世界から脳に流れ込んでくる入力の「一貫したパターン」のなかだけから、それを学習してゆく。
●ここで、新皮質の各領域の階層が、さらに細かく分解される。例えば視覚野のV1野は単一の領域ではなく、おびただしい数の副領域の集合だとされる。V1野が最も多くの副領域で構成され、次いで、V2野、V4野と階層を上るごとに副領域の数は減り、最上位のIT野のみが視野全体を認識する単一の領域であるとする。こう考えることで、新皮質のどの場所においても機能の「均質性」が確認される。
《どの領域に着目しても、下位の多数の領域から入力が集まってくる。入力を受けとった領域は、下位の領域につぎに見るはずのパターンを予測して送り返す。上位の連合野の領域は、視覚と触覚といった複数の感覚の情報を結びつけている。下位のV2野の副領域は、V1野の異なった副領域の情報を結びつける。》新皮質においてはどの領域(副領域)でも、《入力同士の関係を見つけ、その相関をシーケンスとして記憶し、その記憶にもとづいて、将来の入力を予測する》というまったく同じ仕事がなされる。
●ではなぜ新皮質はそのような階層構造をもつのか。それは世界が階層構造によってできているからだとする。音が組み合わさって音程となり、音程がつづいてフレーズになり、フレーズが並んでメロディーとなり歌となる。あらゆる物体は部分に分けられ、そしてその諸部分が「一緒にあらわれる(シーケンス)」ことで物体(名)となる。顔が顔であるのは、二つの目と一つの鼻と口が(一つのシーケンスとして)「同時にある」からであり、目が目であるのは、瞳孔、虹彩、まぶたなどが「同時にある」からだ。《こう考えると、世界じゅうが歌のようなものだ》。《自分の家についての記憶は、新皮質の一つの領域に存在するのではない。家の階層構造を反映した、新皮質の階層構造に蓄えられている。家の全体的な構造は最上位の階層に、部分的な構造はそれに応じた下位の階層に記憶される。》
●脳に流れ込む情報は、パターンのシーケンスという形をとる。シーケンスとは、「きまって一緒に(継起的に)発生するパターンの集合」のようなものだ。目というパターンと口というパターンが継起的に訪れるなら、それに続いて鼻というパターンがいずれ到来するであろうと予測できるのが「顔」というシーケンスである。継起的に流れ込む情報のパータン同士に関連性があり、それによって次のパターンが予測できるなら、新皮質のある特定の領域はそれをシーケンスとして記憶する。トカゲや顔のような具体的なものでも、単語や理論のような抽象的なものでも、脳はパターンという同じ方法で扱う。同一の入力パターンが繰り返しあらわれるということが、そのパターンが現実の対象として存在することの根拠となる。運動をも支配する新皮質は、視線を動かすといった身体の動きによって、その確実性や変化を確かめることもできる。
新皮質のある領域は、いつも一緒にやってくることによって「実在」が確認されたあるパターンの集合(シーケンス)に「名」を与え(記憶し)、それを上位の階層に送る。
●では、最初に入力されるおびただしく変化するパターンが、上位の階層に行くにしたがって変化の頻度が低下して安定するのは何故か。新皮質の各領域は、認識できるシーケンスに名前を与える(状態が「名」となる)。ここで名前とは「同時に興奮するニューロン集団」であり、それによってあるシーケンスのさなかにあることが表現される。その興奮は入力されるパターンに大きな変化がみられないかぎり持続する。つまり上位の階層には、特に大きな変化がみられない限り新たな情報(変化)は送られない。この手順が階層を上る度何度も繰り返される。各層の各領域でシーケンスが「名前をもった対象」へと縮減されることで、階層を上るごとに普遍化(抽象化)が進んでゆく。それによって、最下層の領域では「視線の端を動くなにか」といったものだったシーケンスが、「顔」のような対象として安定したシーケンスへと発展する。
●パターンが階層を下るという逆向きの流れにおいては、普遍の表現がシーケンスへと具体化され「展開」されてゆく。暗記させられたリンカーンの演説を朗誦しようとする時、言語野に蓄積されたパターンが句のシーケンスの記憶に展開され、句が単語のシーケンスの記憶に展開される。そしてパターンは聴覚野と運動野に分かれ、運動野では単語が音素へと展開され、音素が発語するための筋肉への命令へと展開される。普遍的パターンは下位の複数の経路へと展開可能であり、演説の記憶はさまざまな行動としてあらわれる可能性をもつ。最も単純な次元でも、それを書くことも、朗誦することも出来る、というように。
●このことをもう少し詳細にみてみる。新皮質の各領域への下位からのパターン入力は何十万、何百万という軸索によってなされる。千本の軸索がとりうるパターンの種類だけでも全宇宙に存在する分子の数より多い。この膨大なパターンからどうやって規則性を見出すのか。(1)入力を限られた数の可能性の一つに分類し、(2)その後でパターンを探す。(1)では、無限に存在する色をおおまかに「緑」「黄」「赤」「紫」「白」という五つの箱に分類するというように、それぞれ微妙に異なるパターンをとりあえずいくつかのカテゴリーに分類する。その上で(2)、入力において「赤、赤、緑、紫、緑」というシーケンスが頻繁に起きていることを発見し、それを「赤赤緑紫緑」と名付ける。
まず分類が行われなければシーケンスは導けないが、シーケンスが導かれることは分類にも役立つ。一度「赤赤緑紫緑」というシーケンスが発見されれば、赤、赤、緑、の後の入力が曖昧で分類が難しい場合にも、シーケンスを文脈として利用することでそれを紫とすることが出来る。あるいは、赤、赤、緑、の後にくる入力が頻繁に「紫」から大きくズレ、他の分類項にも当てはまらない場合、もともとあった箱のラベルを再検討して書き変え、「紫」のかわりに「青」という箱(分類項)をつくり、「赤赤緑青緑」とシーケンスの名も書き変える。つまり、分類にもとづいてシーケンスが形成され、シーケンスにもとづいて分類が修正されるという風に、両者は相互作用のなかで常に変化している。
●このような分類と予測は、その領域より一つ上位の領域とどう関係し合っているのか。上位の領域では下位から受け取ったシーケンスの名を、その内実は問わずにたんに「名」として扱い、別の入力と組み合わせて、独自の分類と予測によってもう一つ上位のシーケンスを見つけ出そうとする。そして、そこで見いだされたシーケンスに従って、下位の領域に、次に入力されるであろう「名」の予測を送る。この上位からの「名-シーケンス」の予測(助言)は、下位の領域にとっては、さらに下位からくる入力パターンから「見つけ出すべき」シーケンスの「指示」として機能する。
●例えばコンピューターにカップを認識させようとする時、多くの研究者はカップの画像や典型的な形状といった「テンプレート」をつくろうとするが、人の脳にはそのようなテンプレートは存在しない。人はある瞬間に網膜に映った像を記憶するのではなく、記憶は新皮質の構造によって、階層全体に分布されて保存される。《脳は現実世界がどう見えるかではなく、どんな構造をしているかにもとづいて記憶する》。
(つづく)