知乎日报

每日提供高质量新闻资讯

头图

如何看待沈向洋 Harry Shum 离职微软?

王嘉平 / 知乎

如何评价沈向洋(Harry Shum)?

王嘉平,关注分布式系统设计和原理,关注区块链共识和扩容技术。

算不上评价,谈谈攻读博士期间,Harry 作为博士生导师的一面,说说学术研究的事情。

利益相关,Harry 是我博士生导师 (中科院计算所),后来加入微软研究院,就成了我上级,从北京到西雅图。

经高人指点,说爆照会火。那就来一张我 2016 年离开微软的第二天,在 Harry 家里把酒畅想未来的照片 ~

经常看到一些同学吐槽读博如何心累,相信不少问题其实自身有关,但导师确实是非常关键的因素。这里告诉大家,什么样的导师让你的博士读得有价值。所谓的带博士生,这个"带"字其实是份量很重的。一个导师可以给博士生很多东西,课题方向,学术经验,科研技巧,甚至帮忙找程序里面的 bug。

但最重要的,一个导师可以给博士生的,是格局,至少是科研的格局。

我非常幸运地得到 Harry 在格局层面的教诲,这一点使我受益匪浅,并一直影响着我其后的人生和职业发展。其实道理并不复杂,只是有些话,如果不是从一个你敬仰的人口中说出来,很可能你根本不会当回事儿。这就是我为什么说,有些东西,只有你导师才能给你。

Harry 说要 aim high

博二,刚刚开始在亚研院实习。也许和其他博士生一样,都有个打杂的开始。过了一年,混了一篇一作的 PG, (Pacific Graphics,收录于 IEEE TVC,SCI 索引,在图形学界属于二流)。我还在琢磨着,继续水更多的 SCI 论文。然后在和 Harry 交流想法之后,被教育了,说要 aim high。做一篇论文,无论投什么地方,要花的时间都不会少,但是学术生涯时间是有限。混个毕业太容易了,但是要让这博士读得值得,需要想清楚要去做什么样的事情。

被 SCI 收录的期刊其实挺多的,做学术来说,SCI 论文这个标准充其量将将够算及格而已。后续的交谈,使得博士期间的使命慢慢清晰起来。ACM SIGGRAPH 是图形学领域的顶会,不像现在 AI 有好多顶会,图形学顶会只有这一个,毫无争议。当时图形学就像现在 AI 领域的关注度,ACM SIGGRAPH 年会,与会者有四、五万人。如果手上不是世界一流的课题,就不要轻易开始做,想多一点,想深一点,直到发现其中具备实实在在的创新,而不是技术上的修修补补或者数学表达上的换皮。

那次之后,目标的转变,给出了直接的结果,在次年的 ACM SIGGRAPH 上发表了第一篇一作的论文, Appearance Manifolds,并且是自己发现的思路。利用空间上分布的不同时变阶段的样本,来构建表观材质随着时间变化的时变模型。这样,建模过程就可以不需要实际采样不同时间点上的样本,只需要一个时间点就好了,然后利用空间上展现的变化来构建时间上的变化。后来多年之后, 发现这个思路早在 1910 年,在天文学中被用到,利用当前时刻观察到的演化在不同阶段的恒星,及其阶段分布,来构建恒星演化的历史进程模型,也就是赫赫有名的赫罗图。当然的赫罗图是个二维的流型,在我的论文中表观数据是更高维的流型。

之后几年,ACM SIGGRAPH 是唯一的目标,偶尔论文被拒,才会去 EuroGraphics, PacificGraphics 以及 CVPR. 那个时代,SIGGRAPH 每年收 100 篇左右,CVPR 每年收 200 篇左右。现在居然 CVPR 每年收几千篇,这通货膨胀也是,呵呵了。

Harry 说要挖坑,而不是填坑

在做 Appearance Manifolds 的时候,有和 Harry 讨论课题方向。当时的论文,自以为思路新颖,算法精妙,但 Harry 说,这只是填坑,很好地对已经存在的研究课题,给出了一个不错的解决方案,这并不是最强的学术研究,并且相信,同时有很多人在研究类似的课题。果不其然,论文发表之后的几个月,耶鲁大学的实验室,康奈尔大学的实验室分别有论文发表在其他的会议上,研究了完全一样的课题,当然给出了不一样解法。

我印象很深,Harry 又一次刷新了我的世界观,做学术,最高等级是挖坑,也就是提出新的有价值的研究对象以及提出新的研究课题。前者,例如,我发现有一个叫电磁波的东西,大家来研究研究;后者例如,电磁波是咋传播的,需要介质吗。因为,学术科研其核心价值观是提出新的想法,并启发更多的研究者做出新的研究成果,从而推进学科的发展。这一点和工程开发的价值观非常不一样,学术科研最被敬仰的不是解决某个问题,而是引发更多问题,使我们对这个世界有更完整更准确的认知。这一点,可能是 R&D 之间最大的认知鸿沟,以至于很多工程领域的人会觉得学术好像没啥用。而事实上,最坚实和普世的解决方案都在学术科研领域被发表,而工程领域的人需要学会去理解和消化。

过了一年,我试着挖坑,并在次年发表第一篇Microfacet的论文,在一个很具体的领域引入了一个全新的课题。这是一个坑,不过不算太大。后续几年的研究工作都围绕着这个课题展开,同时也有全世界的其他学者跟进这个方向,至今偶尔还有这个方向上的论文,送审到我这里。

当然,挖坑不是说取个新名词,网红套路在一流学术研究中是行不通的。很多真正挖坑的论文,甚至一开始都没有提什么新名词,新名词往往是后人总结而来。所谓的坑,核心在差异性,在于其与众不同,背后是对事物的全新认知和思维方式。用当下的眼光,拿能不能解决实际问题来评判学术研究是不可取的。但是现实中研究员、教授都需要开题,结题,都需要有 funding,所以会有人希望看到对工程和产品有直接裨益的东西。但是,这是学术研究对现实的妥协,而并不是学术研究应有的价值观。

这里举个例子的吧,人工神经网络,也就是现在大家说的深度学习,和 支持向量机 (SVM)的历史。神经网络现在被大家吹上天,可是曾经神经网络是被支持向量机吊打了非常长的时间。那个时候,2000 年附近吧,所有人都在玩 SVM,玩 Kernel,乐此不疲,无数修修补补的工作出来。而神经网络相关的论文,几乎都发不出去。因为大家在当时发现,SVM 就是好用,就是比神经网络更容易出好的结果,而且数学上面还漂亮。如果不是三驾马车以及一众其他研究者寒窗死磕神经网络,深度学习时代可能还好推迟好多年。

一个坑之所以成为是个坑,在于他和其他的坑是本质不同的东西,这个差异性是学术价值的核心。就人工神经网络而言,这个差异性在于其模型定义上的根本不同,而这个不同是有可能在日后的工程和产品中成为核心竞争力的。只是在 2000 年的时候,这个优势根本体现不出来。所以我说仅根据对当下工程和产品的裨益来评判学术是不可取的,人工神经网络曾经受到的打压,是现实的悲哀。

这个差异性是什么呢?就人工神经网络而言,相对于 SVM,是可伸缩性。在我们的算力和可用的数据量提升几个数量级的今天,人工神经网络有能力将其模型也同样扩大几个数量级,来应对这个规模,把这些基础设施的提升全部利用起来,但是 SVM 不行。SVM 再怎么修修补补也没法有效地将海量算力和大数据这个基础提升利用起来。这才使得深度学习在之后的时代所向披靡。时至今日,现在的 AI 领域,也大有当年 SVM 玩 Kernel 的风气,无数修修补补的工作,那么,下一个大坑是什么呢?

就计算机科学而言,学术研究为工程和产品准备了各种可能的答案,有些碰巧是当下能用的,但更多是给未来的工程和产品而准备的。学术研究需要脚踏实地,需要时间和耐心,有朝一日,他是会给你一个时代的。

然后第二重要的事情,一个导师可以给博士生的,是团队氛围,团结又良性竞争。

大面上这是我所体会到的,Harry 作为一个博士生导师,最重要的部分,高瞻远瞩的格局。平时微操上,其实很少去骚扰 Harry,基本上自己都能搞定。倒不是说自己什么都会,而是 Harry 一手建立的 VC, IG 两个科研团队,聚集了一批后一辈的牛人,并且有着团结的良性竞争的氛围。我自己数学技巧不好,推公式懵逼的时候,很容易找到人帮忙。而系统架构是我见长,谁碰到搞不定的性能问题,并发吞吐,多线程问题我也会出手,甚至直接上手帮别人 debug。其中,VC 组(Visual Computing)是亚研院的视觉组,里面出了孙剑、林宙晨、谭平、何凯明等 AI 视觉大牛, 这个团队在 Harry 的带领下,可以说开创了全球计算机视觉华人力量的新时代。IG 组(Internet Graphics)是亚研院的图形组,里面出了周昆,童欣,胡志鹏,徐昆,吴小毛等图形学知名大牛以及咱知乎大 V @叛逆者 ,更是引领计算机图形学华人力量的几乎从零开始的,到在国际学术界占有重要的份量。

亚研院其实是竞争非常激烈的地方,记得当时组里聚集了全国高校最顶尖的学生,并且淘汰率非常高。说没有 Peer Pressure 是不可能的,但是大家明白,我们的真正的竞争对手不是坐在你对面的哥们,而是全世界的顶尖高校和科研机构。在 Harry 的科研团队里面,学术研究的独立性非常被强调。发现有价值的课题,找出 idea,这些是学术的根本,这件事情上面需要自己搞定,否则你不会成为一个成熟的学者。Harry 从来都不会主动给大家出课题层面的主意,但是会给详细的反馈。

Harry 常常说,做事要狠。更多的是对自己要狠,把事情想清楚,想透彻,做到极致,否则一旦动手实施,就是在浪费时间。尤其是到了后来,我自己带博士生的时候,更为深切体会。这种氛围,不是来自于平时的教诲,更是来自于身体力行。每每 deadline 附近,通宵熬夜的赶论文时候,所有人都在,包括已经作为亚研院院长的 Harry。大家红着眼讨论或者争执,争是其中的道理和想法,与身份和职位无关。这样的要求和机制,造就了亚研院当之无愧的中国 IT 黄埔军校。说实话,我之前曾以为这样就是日常,直到离开亚研院之后才发现,这样的环境极其难能可贵,凤毛麟角。

这部分底层能力,将一生得益。即使是我离开了图形学研究,跨界到分布式系统,并行计算和区块链领域也一样得心应手。Harry 也曾经一度离开学术研究,执掌必应搜索,将其北美市场份额拉升到 30%。从顶尖学术科研,到顶尖工程产品,在微软这样的体量上完成,Harry 也是前无古人了。

最后贴,我最后一篇 ACM SIGGRAPH 论文,发表的时候已经离开亚研院了。为什么是最后一篇呢?因为 2013 年,我发现 GPU 可以挖矿,嘿嘿。为什么贴呢? 因为和咱 @叛逆者 (Minmin Gong)是共同作者 [手动狗头] ~~ ,一作是我带的第一个博士生,任沛然,现在也是达摩院视频 AI 的顶梁柱了。

最后,感谢能够有 Harry 这样的博士生导师,老板以及现在是投资人爸爸~~

最最后,有兴趣的同学来关注我的专栏,Harry 说了,这个是闪耀的未来 ~~

去中心化数字世界随想