●昨日、「Quantum-Like Bayesian Networks for Modeling Decision Making.」という論文について、早稲田の学生の安部くんからレクチャーを受けた。
https://www.frontiersin.org/articles/10.3389/fpsyg.2016.00011/full
残念ながら、ぼくにはこの論文で結果を導出する数学的な過程について充分に理解できないのだけど、ここで描かれることは非常に興味深い。
いわゆる「囚人のジレンマ」において、(古典的確率論による)理論値と実験によって得られる実測値が著しくズレてしまうという問題がある。ここで重要なのは、たんに理論的な予測の精度というだけのことではない。「囚人のジレンマ」実験の実測値においては、古典的論理(確率論)では前提とされている「当然原理」が破れてしまう。つまり、それを認めるということは、(前提が崩れるということだから)人間の意思決定に関することがらについては、古典的確率論(古典的論理)によっては決して説明できない(それが使えない)現象がある、ということになってしまうということだ。
しかし、量子的な確率論を用いることで、実測値により近い結果が得られる。光子の二重スリット実験にみられるように、古典的確率と量子的確率の違いは、「干渉」の有無によって生まれる(光子を一個ずつ飛ばしても「干渉」の効果があらわれる)。量子的確率を考えるということは、当然原理における「A」または「非A」という排他的状況だけではなく、「Aかつ非A」という重ね合わせによる干渉も合わせて考えることになる。量子的(Quantum-Like)確率を使うことで、その干渉(重ね合わせ・複素数)の効果により、「当然原理」の破れ(当然原理は「当然」ではない)を説明できる、と。
●いくつかの前提についての説明。(1)当然原理について。当然原理とは次のような原理のこと。まず、Aという出来事が起きるか起きないかという排他的な状態がある。そして、行為者(意志決定者)がとりうる排他的選択肢がxとyと、二通りあるとする。このとき「事象Aが起きた時に、行為者が選択肢yよりもxを好み、かつ、事象Aが起きなかった時にも、同様にyよりもxを好む」とする。だとすれば、行為者は、Aが起きているか起きていないかという世界に対する情報を知らない場合にも、選択肢yよりもxを好むべきである、というものだ。これが「べき」という規範的な言い方になっているのは、もし行為者が合理的であるとすれば、当然そうすべきだと考えるということだろう。
わたしが、晴れた(雨でない)日でも雨の日でも、朝食にはご飯よりパンを好むとしたら、今日が晴れか雨かを知らなくても、同様に朝食にはご飯よりもパンを好むはずだ、というようなこと。
《社会科学関連の分野において、この「当然原理」は、ベイズ的な主観確率論やゲーム理論における「非支配戦略の消去」によってナッシュ均衡を求める際に用いられている。すなわち、当然原理が(記述理論として)成立していない場合には、ベイズ的な主観確率論(やそれを用いたベイズ的意思決定論)や、ゲーム理論におけるナッシュ均衡が、記述的妥当性を持たない、ということになる。》
《(…)通常の意思決定理論や確率論が記述的に妥当であることを仮定している社会科学諸分野の理論(ゲーム理論新古典派経済学の理論など)によっては決して予測できない社会現象が存在するということである。》
上の引用は、「量子意思決定論における合理性」(高橋泰城)より
https://www.jstage.jst.go.jp/article/jpssj/46/2/46_17/_pdf
●(2)囚人のジレンマについて(以下の二つの例はどちらも、「社会」というもののモデルの最小単位として「二人」の総合的な幸福度が問題とされている)。
AとBとが共謀して窃盗を行って警察に捕まったとする。二人は別々に尋問される。二人には「黙秘」と「自白」という二つの選択肢がある。二人とも黙秘した場合、警察は証拠不十分で二人を釈放しなければならない。そして、二人とも自白した場合は、通常の罰が与えられる。ここで、一方が自白し、他方が黙秘した場合、自白した者には情報料として報酬が支払われた上に釈放され、他方にはより重い罰が与えられる、とする。この場合、どのように行動するのがもっとも「合理的」であるのか。
Aにとっての「都合の良さ」のグラデーションは、「Aのみ自白で報酬+釈放>二人とも黙秘で釈放>二人とも自白で通常の罰>Bのみ自白で自分は重刑」という順番になる。Bにとっては、「Bのみ自白で報酬+釈放>二人とも黙秘で釈放>二人とも自白で通常の罰>Aのみ自白で自分だけ重刑」となる。ここで、二人にとって(二人合わせた場合)の幸福の最大値は「二人とも黙秘で釈放」である。しかし、二人が事前に申し合わせができないとき、一方が「黙秘」を選択した場合は、「釈放(二番目に良い)」か「重刑(四番目に良い=最悪)」が、半分の確率でやってくる。そして「自白」を選択した場合は、「報酬+釈放(一番良い)」か「通常の罰(三番目に良い)」が、半分の確率でやってくることになる。ここで利己的、かつ合理的(確率的)に考えるならば、「自白」を選択する方がよいことになる。さらに、相手もまた、利己的で合理的な主体だと考えるならば当然「自白」してくると考えられるので、「黙秘」という選択をすることができなくなる。
つまり、二人ともが「合理的主体」であることによって、二人にとっての最も良い選択(二人とも協調して黙秘して釈放)をすることが不可能になってしまう。
これと似た話に、センによる自由主義パラドックスがある。政府からの給付金にかかわりのあるブルーとレッドの二人がいるとする。ブルーは、(1)二人とも給付金を受け取ることを望み、(2)それが不可能ならばどちらか一方だけでも受け取ることができることを望み、(3)一方だけしか受け取れないとしたら、給付金をより必要としているレッドが受け取るべきだと考えている。つまり、現実にあり得る四つの状態のなかでのブルーの優先順位は、「二人とも受け取る>レッドのみ受け取る>ブルーのみ受け取る>二人とも受け取れない(=今となにも変わらない)」、となる。
一方レッドの方は、(1)給付金(施し)を受け取るべきでないと考えていて、(2)もしどちらかが施しを受けなければならないとしたら、ブルーが堕落してしまわないために自分が受け取るべきだと考える。だからレッドの考えによる優先順位は、「二人とも受け取らない(=なにもしない)>レッドのみ受け取る>ブルーのみ受け取る>二人とも受け取る」、となる。この場合、意見の異なる両者の主張のもっともよい一致点は、どちらにとっても二番目に良い状態の「レッドのみが受け取る」ということになる。
しかし、二人の主体的な選択を個別に尊重するとどうなるか。この場合、受給の有無の選択は「自分にとって」のものだけになり、一方の選択によって他方に受給を強制しない形にしなければ「個人の自由」が成り立たない。そうである場合の選択肢は「自分のみが受給される」か「二人とも受給されない(政府はなにもしない)」の二者択一になる。すると、あり得る四つの状態のなかで選択肢が二つに絞られることになる。
ブルーにとっての選択肢は、「ブルーのみ受け取る>二人とも受け取らない(なにもしない)」となり、レッドにとっては「二人とも受け取らない(なにもしない)>レッドのみ受け取る」となる。そして、二人の優先順位を比べた結果として「ブルーのみが受け取る」というところに落ち着いてしまう。これは、四つのあり得る状態の優先順位としては、二人のどちらにとっても三番目なので、「個人の主体的選択」を尊重することによって、どちらにとってもより優先順位の低い(納得のいかない)社会的選択が行われてしまうことになる、というパラドクスだ。
以上のように、「囚人のジレンマ」や「自由主義パラドックス」によって、個人による主体的、合理的な選択の積み重ねによってでは、社会全体としての利益の最大化につながらないという問題が提起されている。
(自由のパラドックスの例は、「量子で囚人を解き放つ」(筒井泉)「日経サイエンス」2013年03号より)
●(3)「囚人のパラドックス」×「当然原理」。囚人のパラドックスのような状況をつくって実験した結果の数値が、当然原理によって予測される状態と食い違ってしまうこと。
囚人のパラドックスに関する五つの実験が過去にある。シェイファー(1992年)、クロソン(1999年)、リー(2002年)、バスメイヤー(2006年)、ヒリストヴァ(2008年)、それぞれによるもの。これらのどの実験の結果も、五つの実験の数値を平均したものも、すべてが当然原理と食い違ってしまっている。
実験では、囚人のパラドックスのような場面において、以下の三つの異なる状況で人々(被験者)がどのように振る舞うのかの確率をみている。(1)相手が「自白」したという情報を得た場合にどうするか、(2)相手が黙秘したという情報を得た場合にどうするのか、(3)相手がどちらを選択したのかが分からない状況でどうするのか。
(1)の場合でも、(2)の場合でも、かなり高い確率(五つの実験の平均で七割から八割)で、人々は「自白」するという選択をした。相手が「黙秘」したと知っても、自白の確率はわずかしか低下しない(相手の「黙秘」を知ることで、協調して「黙秘」とする人は極めて少ない)。これは、Aという状況でも、非Aという状況でも、人々は変わりなく同じ好みを示したという、当然原理の前提に当てはまる。
ならば、(3)の情報のない場合でも、同じ程度で自白を選択する人の割合が高いという結果がでるはずであろう。しかし実際の数値では、(1)と(2)の確率を平均したものよりも、情報がない状況では、自白する人が平均して15%以上低くなっている(その分だけ、相手に対する協力や信頼の度合いが上がっている、とも言える)。
ちなみに、五つの実験の平均値は、(1)相手が自白したと知らされた場合、87パーセントが自白し、(2)相手が黙秘したと知らされた場合でも74パーセントが自白した。この二つの結果を「古典的な確率論」によって計算すると、情報が知らされていない場合の自白の確率は80.5パーセントになるはずだ(理論値)。しかし実験の結果、情報がない場合の自白の確率は64パーセントであった(理論値のエラー率は25.78パーセント)。
この場合、非自白=黙秘であり、自白と黙秘以外の第三の状況はない。にもかかわらず、ここで「情報がない」という状況が、人々の行為の判断に明らかに影響を与えていると、実測的数値が示している。このような状態は、古典的な意味での合理性(確率論)では説明できない。つまり、《通常の意思決定理論や確率論が記述的に妥当であることを仮定している社会科学諸分野の理論(ゲーム理論新古典派経済学の理論など)によっては決して予測できない社会現象》が実際に存在する、のだ。
●以上が、前提。そして、このような状況を、量子的確率を使うことでうまく説明をつけられる、とするのがこの論文だ。ここでは、数学的な過程をすっとばして結果だけをみると(それでいいのか?)、量子的な確率論とこの論文の筆者らによるsimilarity heuristicとを用いて、(1)と(2)の実測された確率から(3)の値を予測すると、自白の確率は72.08パーセント(エラー率12.63パーセント)になる、と。実測値の平均は64パーセントなので、ズレが小さくなったとはいえ、やや微妙な数字とも言えるけど、これはあくまで五つの実験の平均値についての計算であり、個々の実験についてより正確に計算すると、エラー率はかなり下がるということも示されている。
量子的な重ね合わせが、それが観測されていないことによって成り立っているのと同様に、人間の意思決定に関する(非排中律的な)確率の重ね合わせ(干渉)もまた、相手の選択に対する「情報がない」ことによって生じる、と考えることができる。相手にかんする情報がないことによってかえって、他人を信頼する(他人と協調する)ことの出来る確率が高まる、ということになる。
高エネルギー加速器研究機構(KEK)の筒井泉は、前述した「量子で囚人を解き放つ」で次のように書いている。
量子力学は原子崩壊などの物理的過程の起きる確率や物理量の測定結果を確率的に予言するものであり、数学的な枠組みとしては確率論の一種とみることができる。量子力学という名の、ある特別な確率論が存在し、それがミクロの世界を記述するのに極めて有用なのである。そしてその同じ確率論は、なぜか社会学的な意思決定の考察にも使うことができる。》
量子力学が予言する確率というのは、何を表しているのだろうか。ある状態を繰り返し測定したときに見られる現象の相対的な頻度を表す客観的なものだとするのが、現在の標準的な考え方である。一方で先に述べたように、量子状態とは測定者がその対象について持っている情報を表すものだとする立場もあり、そうすると測定者ごとに異なる量子状態があることになるから、その確率も、測定者によって異なる主観的なものだということになる。》
ゲーム理論や意思決定における量子力学の応用は、量子力学の確率論としての数学的な枠組みに思わぬ汎用性があることを示している。ここに示した応用対象は、いずれも情報の獲得(や秘匿)と確率的予言を共通の要素としている。》
●とはいえ、量子的確率によって「当然原理」の破れを受け入れるということは、古典的な論理における合理性が、必ずしも合理的とは言えないということになってしまうので、以下のような事態を受け入れるということにもなりかねないのだ。「量子意思決定論における合理性」(高橋泰城)より。
《もし、この「当然原理」が成立しないとすると、あなたが交差点を渡るかどうかという意思決定を合理的に行うために、目前の信号が青かどうかという知識だけでなく、宇宙全体に関する完全な知識(銀河系の外側にある場所に見いだされる素粒子のスピンの向きや、火星に生命体が存在するかどうか、などまで含めて)を知る必要がでてきてしまう。》