卒研IIレジュメ

TIT-FOR-TATからOUT-FOR-TATへ
− ネットワーク型囚人のジレンマにおける戦略選手権 −

1993. 『理論と方法』 13:19-32

1997年12月15日 伊戸川 暁


「ネットワーク型囚人のジレンマ」とは

指名戦略の重要性は、これ以前の研究で既に明らかになっている。

当論文におけるシミュレーションの流れ

  1. 各戦略は希望する相手の指名リストを作る
  2. 各戦略の指名リストに従って、その回の組み合わせを決定する (人数が奇数の場合、あぶれる人が出ることになる)
  3. 決定した相手と従来からのPDを行い、行動戦略に従って点数が与えられる
これを500回繰り返したものを1セットとし、100セットの合計で戦略を評価する。

戦略について

TFT(Tit For Tat)

「強い」行動戦略の代表。
「初回は「協力」をし、2回目以降は直前の相手の戦略を返す」というもの。
4大特徴:
  1. 上品さ(自分からは裏切らない)
  2. 報復性(しかし裏切り者には裏切りをもってする)
  3. 寛容性(でも1回で許す)
  4. 単純性(行動パターンが分かり易い)

OFT(Out For Tat)

指名戦略の一種で、「協力」してくれた者をリストに加え、 「非協力」だった者はリストから外す というもの。
報復性と単純性を備えている。

戦略の分類

非協力的な者へのサンクションを指名戦略で与えるか、行動戦略で与えるか?

結果(1)

応募のあった9戦略1つづつの集団を作り、simulationを行った。
詳しくは論文プリント参照。
  • やはりOFT戦略が有利。
  • 行動戦略ではむしろ「全面協力」の方が有利。
  • 参加回数の多い方が有利。

    結果(2)

    種々の条件を変えてシミュレーションをしてみると……。
  • 人数は偶数か奇数(必ずあぶれる者が出る)か
    偶数になることによって成績が大巾に改善されたものがあった。
  • 指名戦略のみが違う場合
    行動戦略をみな同じにしても、あまり結果は変わらなかった。
  • 戦略構成が異なる場合
    ランダムな戦略を4つほど混ぜたところ、各戦略の差は縮まった。
    「上品な」戦略はランダムな戦略に振り回され、 そうでない者はランダムな戦略を食い物にしたからだと考えられる。
  • 不確実性の導入(相手が誰か/どのような行動を取ったか)
    相手の不確実性→上品さが決め手になる
    相手によって行動を変える戦略は 得点が有意に下がった
    行動の不確実性→より寛容性が重要になる
    一度「非協力」した者でも時間が経てば許してあげる戦略がより優位に立った。

    我々の研究のための拡張案

    上の研究のシミュレーションに、以下のような要素を追加することが考えられる。
  • 各人の取る戦略が経時的に変化するようにする
    「特定の傾向を持った者のみが選ばれ、適合しない者は排除される」の他に、 「各人が変わることによって集団から受け入れられるか否か」を探ってみたい
  • 成員の入れ替わりを可能にする
    これによって「集団の経時的変化」を見たい
  • 「位置」というか「距離」の概念
    距離が遠いと対戦できる可能性が小さくなる、とか。
    itogawa6@dolphin.c.u-tokyo.ac.jp