人机与认知实验室

人机与认知实验室

如果1 和2 两个人都知道E 事件, 1 知道2 知道E 事件, 2 知道1 知道E 事件, 1 知道2 知道1 知道E 事件, 以此类推, 那么我们就称1 和2 对于E 事件具有公共知识(common knowledge)。定理:如果两个人有相同的验前知识(prior), 并且他们对于一个事件A 的验后知识(posterior)是公共知识, 那么, 这些验后知识相等。


如果两个人有相同的验前知识(prior), 并且他们对于一个给定的事件A 的验后知识(posterior)是公共知识, 那么这些验后知识就一定是相等的。即使他们的验后知识是建立在不同的信息的基础上,在这样的情况下, 这一点也是成立的。简单说来,就是有相同验前知识的人不可能达成不一致。

我们在公布这个观察结果时多少有点缺乏自信, 因为一旦人们有了适当的框架, 从数学的角度来看, 它就会变得是微不足道的了。尽管如此, 从直观上, 这个结果并不是非常明显的;并且, 在人们对于彼此信念的信念有价值的领域, 如博弈论和信息经济学中, 这个结果具有一定的意义。这篇论文的结尾给出了一个能够说明问题的“具体的” 例子(该例子能够做这样的读解)。

核心概念是“公共知识”概念。我们称两个人分别为1 和2 。当我们说某一个事件是“ 公共知识”时, 我们不仅仅意指1 和2 都知道这一事件;我们也意指1 知道2 知道这一事件, 2 知道1 知道这一事件, 1 知道2 知道1 知道这一事件, 以此类推。例如, 如果当某一事件发生时, 1 和2 都在场, 并且看到彼此都在场, 那么这一事件就成为了公共知识。此时, 如果1 和2 告诉彼此各自的验后知识,并且彼此信任, 那么这些验后知识就是公共知识。如果我们仅仅假设人们知道彼此的验后知识, 那么上述的结果不一定正确。

形式化一下。用(Ψ, B , p)来表示一个概率空间, T1 和T2 是Ψ的划分(partition ), 它们的并T1 ∨ T2由非空的事件组成。对之的解释是:(Ψ,B)是关于世界的状态空间, p 是1 和2 的公共验前知识, Ti 是i 的信息划分;即, 如果世界的真实状态是ω, 那么i 知道, Ti 中的Pi(ω)包含了ω。给定Ψ中的ω, 一个事件E 在ω中被称为是公共知识,如果E 包括了T1 ∧ T2 集合中含有ω的成员。我们将在下面阐明, 这样的一个定义等价于前面给出的非形式化的描述。

用A 来表示一个事件, 用qi 来表示在给定i信息下A 的验后概率p(A(T1));也就是, 如果ω∈Ψ, 那么qi(ω)=p(A ∩ Pi(ω))/p (Pi (ω))。命题:设ω∈ Ψ, 并且设q1 和q2 来表示数量。如果它是在ω中的公共知识, 即q1 = q1 并且q2 = q2 ,那么q1 = q2 。

证明:用P 来表示包含了ω的T1 ∧ T2 的成员。记P =∪ j Pj , Pj 是T1 中不相交的成员。因为整个P 中, q1 = q1 , 对于所有的j 我们有p(A ∩Pj)/ p (Pj)= q1 ;因此p(A ∩ Pj)= q1 p (Pj), 通过把这些j 都加起来, 我们可以得到p(A ∩ P)=q1 p (P)。同理p(A ∩ P)= q2 p (P), 所以q1 =q2 。证毕。

为了看清“公共知识”的形式化定义是等价于非形式化的描述, 我们设ω∈ Ψ, 并且, 我们称Ψ中的一个成员ω' 与ω有可及关系, 如果有一个序列P1 , P2 , …, Pk 满足ω∈ P1 , ω' ∈ Pk , 而连续的Pj 是相交的, 或者属于T1 或者属于T2 。假设:ω是世界的真实状态, P1 = P1(ω), 并且E 是一个事件。说1“知道” E 意味着E 包含了P1 。说1 知道2知道E , 意味着E 包含了在T2 中所有与P1 相交的P2 。说1 知道2 知道1 知道E , 是指E包含了在T1 中与在T2 中与P1 相交的P 2 相交的P3 。以此类推。因此, 所有“ i 知道i' 知道i 知道…E”(其中i ' =3 -i)这样形式的语句要为真, 当且仅当,如果E 包含了所有与ω有可及关系的ω' 。但是所有与ω有可及关系的ω' 所组成的集合是T1 ∧ T2的一个成员;我们希望的等价关系就这样建立起来了。

当人们仅仅知道相互的验后概率的时候, 这个结果不成立。假设Ψ含4 个元素:α, β , γ, δ, 它们有着相同验前概率;T1 ={αβ , γδ}, T2 ={αβγ, δ},A =αδ, 并且ω=α。1 知道q2 是1/3 , 2 知道q1 是1/2 ;但是2 认为1 也许不知道q2 是1 还是1/3 。

值得注意的是, 信息划分T1 和T2 它们自身都是公共知识的这个暗含假设。实际上, 这不会造成对一般性的损害。把一个信息告知两个人的方式,包含在对这个世界的一个状态ω的完全描述中。这意味着, 信息集合P 1(ω)和P2(ω)精确地被定义为ω的函数, 并且, 双方都知道这些函数。

接下来考虑不同的人有相同验前知识的假设。约翰·哈萨尼[1] (Harsanyi , 1968)曾雄辩地论证, 主观概率的不同应该无例外地追溯到信息的差别:有精确相同信息的人们坚持不同的主观概率, 这是没有理性基础的。这和相同验前知识的假设当然是等价的。本篇文章的结果可能被认为是反对这种观点的证据, 因为实际上存在这样的人, 他们相互尊敬别人的观点, 但其内心上有不同的主观概率。但是这个证据并不是决定性的:即使彼此尊重对方聪明才智的人, 也会把彼此的错误归因于验后知识的计算错误。当然, 我们指的不是简单的算术错误, 而是如特沃斯基[2] 1 124-1 131和卡尼曼(1974)[3]讨论的系统性的偏执。在私下交谈中, 特沃斯基认为, 人们也可能因为心理因素出现偏执, 使得他们漠视那些令人不愉快的或与已形成的观念不相符的信息。

有大量关于在主观概率上达成共识的文献。最近有篇文章是德格如特的[4] DeGroot , 1974), 从中可以找到关于此主题的文献。一种“实用” 的方法是Delphi 技术[5] (如,Dalkey , 1972)。在我看来这些文献中许多地方都暗含了哈萨尼学说;如果假定的信息交流是成问题的, 则对主观概率进行协调是有意义的;而如果我们谈论的是验前知识中“天生”的不同, 则这种协调是没有意义的。这篇文章的结果能够被认为是协调主观概率的理论基础。

举一个例子。假设1 和2 有关于硬币参数的统一验前知识, 并且设A 表示在下次掷硬币出现H(正面)的事件。假设允许每个人先掷一次, 并且假定投掷的结果分别出现了H 和T(反面)。如果每个人的信息由他的投掷结果组成, 那么A 的验后知识将分别是2/3 和1/3 。如果接下来每个人都告诉另外的人他的验后知识, 那么他们将都会得出结论:先前的投掷结果是一次H 和一次T , 所以两人的验后知识都将修订为1/2 。

现在假设允许每个人都先掷几次, 但是每个人都不知道对方被允许掷了多少次。比如, 也许两人都掷了4 次, 1 的投掷结果是HHHT , 2 的投掷结果是HTTT 。然后他们告诉对方他们各自的验后概率分别是2/3 和1/3 。这些验后概率也许源于一个单一的观察, 或者源于四个观察, 或者源于更多的观察。因为没有人知道另一个人的验后概率是根据什么观察得出的, 他会倾向于给自己的观察多点权重。即使在这样的情况下, 验后概率也面临部分修正, 但是这并不意味着这必将导致相同的验后概率。

假定这种修正考虑了每个人的投掷数方面的验前概率。假设两个人的验前概率是相同的, 但是每个人得到额外的私人信息, 即他被允许的实际投掷数。使用这个验前概率和信息(验后概率分别为2/3 和1/3), 新的验后概率能够被计算出来。如果投掷者把这些新的验后概率告诉每个人, 概率将面临进一步的修正。我们的结果意味着, 在A 的验后概率上的信息交流过程将一直继续, 直到这些验后概率相等为止。


参考文献:

[1]HARSANYI J.Games of incomplete information played by Bayesian players, Parts I -III , Management Sci[J] .1968 ,(14):159-182, 320-334, 486-502.

[2]TVERSKYA,KAHNEMAND.Judgment under uncertainty:Heuristics and biases[M] .Science, 1974 .

[3]AUMANNRJ.Subjectivity and correlation in randomized strategies[J] .Math.Econom , 1974 ,(1):67-96.

[4]DEGROOTMH.Reaching a consensus[J]. Amer.Statist Assoc,1974, (69):118 -121.

[5]DALKEY N C.Studies in the Quality of Life[M] .Lexington Books, Lexington , Mass , 1972.


本文作者罗伯特·奥曼(Robert John Aumann)(1930 -), 著名的博弈论专家, 以色列耶路撒冷希伯来大学教授, 2005 年诺贝尔经济学奖获得者。本文为认知逻辑的经典论文, 也是罗伯特·奥曼的重要论文。


本文由南京大学沈洁、吴瑶译, 潘天群校

12-16 18:04