ABSコンペティション

論文要旨

空間配置型N人版囚人のジレンマゲーム

 田村 誠*

Makoto TAMURA

 

 

繰り返し囚人のジレンマ(Iterated Prisoner’s Dilemma: IPD)は、抽象化されたシンプルな状況でありながら利己的な個人による協調の進化に対する説明としてよく知られている。とりわけAxelrod(1984)が行なった、二種類の戦略が繰り返し対戦トーナメントは有名である。このトーナメントではTFT(Tit for Tat)戦略が二度にわたって優勝した為、TFTIPDの最強戦略と解釈されてきた。しかし、その後Nowak and Sigmund(1993)らによってTFT戦略には幾つかの弱点も指摘されている。Axelrodも記述しているが、本来、ある戦略が勝つか否かはあくまでも相手戦略との相互関係に依存するのである。さらに、人間社会、あるいは生態系などに対して囚人のジレンマゲームをより妥当なモデルとする為には参加するプレーヤーを増やすことが考えられる。

こうした問題意識から本稿は以下のような構成で議論を進める。まず、マルチエージェントシミュレーションの特性を生かし、戦略模倣ゲームとしてモデルを定式化して空間上に複数戦略が同時に存在するIPDを実行する。従来、数理生態学の分野を中心に研究されている空間配置型N人版IPDモデルでは、TFT戦略を基本にして、前回の相手の戦略に対して確率的に戦略が反応するように設定されていた(Nowak and May(1992,1993)Grim(1995)Nakamaru et al(1998)など)。これに対して本稿は、各エージェントの戦略を明示的に規定し、より複雑な戦略を同時に存在させている。

次に、先行研究において安定的に強いと指摘されている戦略の有効性を再検証した。この際に、ABS(Agent Based Simulator)を利用することで視覚的にもこのような戦略の動態が観察できることは本稿の一つの特徴に挙げられる。果たしてTFT戦略が勝ち残るのか、それとも他の戦略が台頭するのであろうか。そして、もしその他の戦略が勝ち残るのであれば、如何なるメカニズムが作用しているのか議論した。

その結果、Friedman戦略がTFT以上に勝ち残ることが観察された。二人版IPDでは裏切り者は明白だが、多人数版IPDでは裏切り者の特定が難しくなる。また空間上に存在することで報復相手が必ずしも報復し返してこない場合がある。それ故、このような匿名性の高い社会モデルにおいては、Friedmanのような報復的な戦略が勝ち残ったと考えられる。



*東京大学大学院総合文化研究科広域科学専攻(Department of General Systems Studies, Graduate School of Arts and Sciences, Univ. of Tokyo.) E-mail:tamura@sanshiro.c.u-tokyo.ac.jp

論文のダウンロード(PDF書類、172KB)

モデルファイルのダウンロード(28.4KB)