是最复杂那个,作者为“匿名”。这个作者引发些饶有兴趣猜测:五角大楼高层?中央情报局首脑?国务卿基辛格?阿克塞尔罗德自己?们也许永远也不会知道。
不是每个策略细节都值得研究,这本书也不谈计算机程序员创造力。但们可以给这些策略归类,并检验这些类别成功率。阿克塞尔罗德认为,最重要类别是“善良”。“善良”类别指是那些从不率先背叛策略。“针锋相对”便是其中个例子。它虽然也采取“背叛”行动,但它只在报复中这做。“老实人探测器”与“愧疚探测器”也偶尔采取“背叛”,但这种行为是主动起意挑衅,属于恶意策略。这场竞赛中15个策略中,有8个属于“善良”策略。令人吃惊是,策略中前8名也是这8个善意策略。“针锋相对”平均分504.5分,是们600分基准分中84%,个很好分数。其他“善良”策略所得分数要比“针锋相对”少些,从83.4%到78.6%不等。排名中接下来分数则是由格雷斯卡普(Graaskamp)所获得66.8%,与高分们有很大差距,而这已经是所有恶意策略中最高分。令人信服结果表明,好人在这个博弈中可以胜出。
阿克塞尔罗德另个术语则是“宽容”。个宽容策略只有短期记忆。虽然它也采取报复行为,但它会很快遗忘对手劣迹。“针锋相对”便是个宽容策略,面对背叛时它毫不手软,但之后则“过去让它过去”。第十章中“斤斤计较者”则是个完全相反例子。它记忆持续整个博弈,永不宽恕曾经背叛过它对手。在阿克塞尔罗德竞赛中,有个策略与“斤斤计较者”完全相同,由位名叫弗里德曼(Friedman)选手提供。这个“善良”而绝不宽恕策略结果并不算佳,成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意,它不愿意打破相互背叛恶性循环,因此无法取得很高分数。
“针锋相对”并不是最宽容策略。们还可以设计个“两报还报”(TitforTwoTats)策略,允许对手连续两次背叛后才开始报复,这似乎显得过分大度坦荡。阿克塞尔罗德算出,只要在竞赛中有“两报还报”策略存在,它便定会获得冠军,因为它可以有效避免长期互相伤害。
于是,们算出赢家策略两个特点:善良与宽容。这几乎是个乌托邦式结论:善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招,认为这可能得到高分
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。