立即下载 知乎日报 每日提供高质量新闻资讯

既然博士待遇没比硕士多多少,为什么还有那么多人选择读博?

图片:Yestone 邑石网正版图库

既然博士和硕士待遇差不多,那么为什么还有很多人要读博士呢?

司马懿,《穿越历史聊经济》作者

在《上海交大就业质量报告 2014》里发现博士和硕士待遇差不多,甚至还差点,那么为什么还有很多人要读博士呢?

看了一些答案,发现很多都是在抒发对科研的情怀,对思想自由的向往……如果说个体可能存在强烈的情怀倾向的话,博士和硕士作为一个数量相当庞大的群体体现在表格上,真的和情怀啊自由啊没什么关系,在没有恰当的识别策略和更详细数据的情况下,单从这个表格上,我们无法得出博士比硕士待遇好还是差的结论。

其实已经有回答给出了一个辛普森悖论的例子。为什么会有辛普森悖论呢?因为硕士和博士的比例并不是一致的。比如说经管学院一般来说有大量的专业硕士,而博士生比例较小;但是以实验为主的一些理科院系,因为实验室需要大量的人力,所以博士生的需求比较旺盛,而硕士只是博士的一个中转,没有专业硕士。所以硕士总人数中的专业比例,和博士总人数中的专业比例很可能就不是一致的。

所以,如果硕士人口中热门专业,比如 CS 和经管金融相对比较高,而博士比例中不那么热门的专业比例比较高的话,完全可能出现如下情形:单独看每个专业内部,博士待遇都比硕士好,但是因为热门专业的硕士待遇比冷门专业的博士好,而博士中冷门专业比例大,所以加总起来,呈现了博士平均待遇不如硕士的情况。

但是,这只是其中一个解释。如果经过调查发现,博士专业比例和硕士专业比例差不多(当然这个是不可能的,我们只是假设),或者说上述统计就是某一个专业的所有读博士的个体的数据,是不是就能说明博士不如硕士呢?其实也不一定!

从本科毕业到博士,有两条路径,一条是“本硕博”,一条是“直博”。两者的区别在于,前者在中间会拿到一个硕士学位。因为这个硕士学位,瞬间就给学生带来的很大的灵活性,因为当拿到硕士学位之后,学生是可以放弃读博去工作的。而直博则没有这个选项,中途退出拿到的是本科学位。

这里面就有两个效应了。首先,因为本硕博的灵活性,大家能争取一般都会争取这,而本硕博的名额也较直博更少,于是这种事实上的竞争机制下,往往成绩比较好的人更有和学校、和导师讨价还价的能力,有更大的概率可以拿到本硕博的资格。而离开成本较小的,也是这批本硕博的学生,那么当我们比较本硕博中硕士阶段就离开的硕士和直博中一直熬到最后离开的博士的时候,其实需要考虑他们当初的成绩平均值很可能就是不同的这一因素。

其次,当一个读博士的人中途离开的时候,无论他是辍学,还是拿到硕士离开,他必然是遇到了一个我们单纯从数据上看无法识别的机会,导致他认为自己留下来继续读的总收益不如离开的好。就像比尔盖茨一样,他辍学可以开创微软,是因为他觉得不能再等下去了,耽误两年,就算拿到了哈佛的学位也不足以弥补失去商业机会的损失;但是这不代表一个学生辍学本身对创立公司有任何正向的加成。

所以读博中途离开,绝不是一个随机事件,而是一个自我选择(self-selection),因为只有看到了足够大的机会的人,才会放弃继续读博而去工作,这也可能导致硕士毕业的薪水甚至可以高于博士。这个时候,数据具有非常强的内生性(Endogeneity),无论是单纯地看描述性统计,还是简单地做个回归,都可能会带来困扰——既然硕士的收入都高于博士了,为什么还要继续读博士呢?但是数据无法告诉我们的是,这些中途离开的硕士都看到了什么样的机会,比他们认为自己留下拿到博士学位的收益还要高多少。因为我们无法在现实世界将这些人的另外一种可能性:继续读下去拿到博士学位的收入统计出来,因为这个数据不存在,同样的道理,我们也不知道那些一直坚持读完博士的人中间退出会拿到多少薪水,一切都是每个个体按照自己的偏好和一些隐藏信息自我选择的结果,而不是随机的。所以其实我们无法比较,一个人随机的选择读博和读完硕士就退出,他们的平均薪水谁高谁低,而这才是我们所感兴趣的——如果一个人随机的选择读博,其他条件相同,苦哈哈的读了三年后的收入还不如现在拿个硕士就退出的收入,要么他所处的行业正是风口,要么我们确实我们需要检讨一下教育机制了。

所以我们需要一个策略来识别(identification),这个策略必须包含一个和学生无关的,来自外界的因素,因为任何和学生自己相关的因素都面临同样的内生问题(其实这个问题更复杂一些,因为每年毕业的硕士和博士都是不同的,这样的数据叫做伪面板数据(Pseudo-Panel),这种数据本身就依赖于一些外生的变量来进行分组,而这又造成了其他的问题,这些讨论和主题无关,纯技术细节这里就不深入了)。

比如当地政府如果突然规定,只有博士才能拿到户口,硕士不予以解决。那么这显然就是突然地提高了博士学位的附加价值,也就意味着,面临某些不大不小的机会,可能一个硕士之前会选择离开就业,而现在则会选择留下来读书(在这里我们还要假定我们不考虑因为博士学位附加值增加,而给博士工资带来的可能的负面的冲击……其实完全有可能是这样的,因为博士学位附加值高了,所以用人单位给博士降薪了,导致事实上人们的选择没有任何变化,但是考虑到工资是有棘轮效应的,容易上但是不容易下,所以这个假设还算在一定程度上是合理的)。那么这个时候,这个“是否解决户口”就通过影响一个人选择是留下来读博士还是直接硕士毕业,但是不直接的影响博士的工资,于是我们就可以利用这个一点,用“是否解决户口“来过滤一次”是否有博士学位“,解决了内生性问题,然后就可以通过回归来得到真实的博士学位相对于硕士的影响。原理可以参考这个答案:

工具变量 (Instrumental variables) 的作用到底是什么?

当然,其他的方法还有很多,上面只是举了一个例子。但是这个足以说明,单独看这个一个统计表格,如果没有恰当的识别策略,从好处说,我们可能从数据上得不到任何有效的结果;从坏处说,数据还可能误导我们,作出无关甚至于相反的推断,对于政策制定者而言,那将不啻于一场灾难。

After all, to understand data is all about identification.

扫描二维码下载知乎日报

支持 iOS 和 Android
二维码下载知乎日报
阅读更多 我不逗逼,但我是猩猩「派」来的 下载 「知乎日报」 客户端查看更多