知乎日报

每日提供高质量新闻资讯

头图

每一步都是博弈,「世界」和「我们」并不是平等的对手

Yestone.com 版权图片库

从经济学角度来看,「走一步看一步」是一个好建议吗?

阿虎,资深多动症爱好者

我认为这个问题实际上涉及到个人认知能力与未来可预测性之间的关系,目前在决策理论中讨论的非常多(不知道是我被自己洗脑了还是这个问题确实太重要了)。我尝试简单介绍一点点。

与“相机抉择”(走一步看一步)对立的观点暂且称为“一以贯之”。我的观点是,二者的优劣取决于你在大世界还是小世界。下面我将尝试解释我的观点。

Savage 提出过一对概念“小世界”和“大世界”。在小世界中,我们可以提前列出所有的可能性并且基于此进行计划,因此在小世界中,人们三思而后行(look before you leap)。一个小世界的例子就是打扑克,你可以穷尽所有的牌型,并且大概知道每种牌型出现的概率,因此可以进行计算和计划。相反,在大世界中,我们可以列出很多未来的可能性但是我们无法保证自己是否穷尽的全部的可能,因为我们不知道是否还有超出我们的理解和想象的事物存在。大世界的例子在现实中数不胜数,高考、考研、谈恋爱甚至职业选择。在做决策时我们可以列出很多可能,但是我们不敢保证我们没有忽视什么,而且事实常常证明事情总是不按照我们想象中任何一种可能发展。所以 Savage 说,在大世界中,我们遇山开路遇水搭桥(Cross that bridge when you come to it)。

感谢陈茁给出了 Savage 的主观期望效用理论,不过 Savage 一再强调他的模型只是适用于小世界。显然,当你无法穷尽世界的无限可能时,你为每件可能所赋予的概率值都显得不那么靠谱。还有一点是,Savage 的模型是一个 as-if 逻辑,即是说如果你的选择符合 7 条公理,那么你就仿似再做一个期望效用最大化。此逻辑并没有告诉你是否真的存在这么一个辅助选择的主观概率,只是告诉研究者,无论这个人怎么想,我们都用这样一个方法可以刻画他的选择行为。因此它是工具,而非指导。或者,它是一个实证(positive)模型而非规范(normative)模型。

不过 Savage 模型确实是经济学的基础,进而 Bayesian 方法也变成了主流。Bayesian 主义认为人们从完全无知开始,不断吸收信息,不断更新自己的信念(belief),进而所需要考虑的可能性越来越少且越来越精确,因此世界在不断变小。但是实际上,我们发现随着我们长大,也有一种力量使我们的世界不断变大:我们可以认识到了新事物。这些新事物本身就没有出现在我们事先的考虑中。例如,Karni 和 Viero(2013)AER 就写到:

According to the Bayesian paradigm, as new discoveries are made and new information becomes available, the universe shrinks: with the arrival of new information, events replace the prior universal state space to become the posterior state space, or universe of discourse. This process of "destruction" reflects the impossibility, in the Bayesian framework, of expanding the state space and of updating the probabilities of null events, coupled with the fact that conditioning on new information renders null events that, a priori, were nonnull. Yet, experience and intuition alike contradict this view of the world. Becoming accustomed to possibilities that were once inconceivable is part of history and our own life experience. There is a sense, therefore, in which our universe expands as we become aware of new opportunities.

从这个角度来回看,Bayesian 主义所考虑的无知并不是真正的无知,而是小世界下的“不确知”:决策者知道全部可能但是不知道真实世界是哪一个。与之相对的是大世界下的无知,决策者既不知道真实世界是哪个,甚至不知道世界有多大。学术一点,因此我们要学习和更新的不仅仅是状态空间上的分布(distribution on state space),更是状态空间本身(state space per se)。更困难的是,两个过程是同时进行的。据我所知,经济学中,尤其是决策理论中在讨论大世界下的学习理论的仅有 ambiguity 和 unawareness 两个领域。

写到这里,实际上应该进一步谈谈经济学理论是如何扎根于小世界理论以及这样可能会有哪些偏差。不过,我想这个问题写起来难免啰嗦,所以不妨留给大家。

现在,回到最初的问题,相机抉择还是一以贯之?我认为答案是取决与决策问题更接近与大世界还是小世界。很多事情别人已经用经验验证了无数遍,我们可以几乎将其看成一个小世界时,利用现有经验找到最适合你的计划然后一以贯之。这个例子实在是太多了,比如考试后才发现当初应该按计划复习。但是也有很多事情没有太多先例,比如科研,只能一边做一边思考一边调整计划。

如何在实际中区分大世界和小世界?这个问题我想没有统一的答案,因为每个领域科学的进展都不相同。因此,我认为这是一个思考的起点,而非终点。

司马懿,《穿越历史聊经济》作者

这个问题其实不一定要看作博弈,因为“世界”和“我”不是对等的对手。世界并不会有意识的和个人博弈——我承认确实有一些模型,我们可以把自然引入进来,给自然赋予一个属性,比如总是在最小化风险之类,然后让人和自然进行博弈求均衡。

但是就题主这个问题来说,看作动态规划和看作动态博弈是等价的,因为自然的反应是可以预期的,并且我们不需要在乎“自然”的效用,我们只在乎自己的效用,那么还是等价于你选择一个行动,然后每个行动产生一个效用,你试图在最大化总效用。

假如你认为人生只会进步,不会退步,区别只是进步大一点和小一点的话,那么走一步,看一步是和预先老谋深算的盘算一番是一样的,在这种情况下,人生就是一个带正权重的有向无环图,从出生到死亡。

从出生开始,我们只需要看看我们周围可以做的选择,选效用最高的那一个,到了下一个目的地之后环顾四周,发现新的选择,也发现新的可以达到目标的方法,然后看看周围的选择是不是比现在的好,如果是的话,就跳过去,如此反复,可以保证我们选择的是一条整体效用最高的路径,这就是戴克斯特拉算法。

这个算法最大的特点就是可以走一步看一步,每一步都选择最优的,最后必然能得出一个全局最优,他发明了一个术语叫做“松弛”,每一回合,通过自己新发现的路径来检测自己之前做的选择是不是最优的,如果是的话,就保持不变,如果不是,就修正为新的路径。

但是戴克斯特拉算法有个最大的假设,就是没有负效用的道路,这是不是符合人生的现实呢?看标准怎么定义了,有人认为只要是经历,都是财富,有人认为自己绕弯路回到了原点,那就是完全的浪费。

如果你认为人生是可能有死循环的,有负效用的,戴克斯特拉方法就失效了。这个时候就要采用贝尔曼 -- 福特算法来找出最优路径。

很遗憾,在这种情况下,走一步看一步就无法保证最优解了。必须要打开上帝视角,预先对路径上的每一条边都进行松弛操作,反复多次之后,每一个点所对应的最短距离都慢慢的变成了“正确”的最短距离,于是我们真正需要找的那个最短距离也就慢慢的浮现出来了。

所以啊,不同的人生态度对应不同的算法,豁达一点的呢,认为人生就是风景,有进无退,那么就直接戴克斯特拉算法, 走一步算一步,人生就已经是最完美的,无需过多的算计;但是如果你认为人生是充满陷阱、机遇和挑战的,存在着死循环和坑,那么最好还是多盘算盘算,走一步看一步,没准哪天就走到一个周围全是负向量的“坑”里面,多盘算盘算才能获得更高的效用。