昊梵体育网

看了张小珺发的播客,感觉姚顺宇真的是一个很有意思的人。清华本科学物理,斯坦福博士

看了张小珺发的播客,感觉姚顺宇真的是一个很有意思的人。

清华本科学物理,斯坦福博士读高能物理,研究的是量子场论和弦论。

结果博士毕业之后,他直接彻底离开物理,转行做AI了。

先去了Anthropic,参与了Claude 3.7和4.5的开发;然后又跳到了Google DeepMind,赶上了Gemini 3。

两年时间,把两家顶尖AI公司的核心项目都经历了一遍。

但我觉得很值得聊聊的,是他说话的方式。

他说:AI个人英雄主义时代已经过去了。

1

姚顺宇本科在清华做的是凝态理论,很快就做出了范式级的学术成果。

按正常剧本,他应该继续在物理领域深耕。但他偏偏选了一条更难的路,博士去斯坦福读高能物理。

高能理论有多难呢?这么说吧,这个方向发展到今天,实验已经完全追不上理论了。

你提出一个框架,没有办法用实验去验证它。判断你做得好不好,很大程度上依赖于领域里一些权威人物的主观判断。

他在博士期间的体会是:从外界标准看,我的论文没人说不好。

但摸着良心说,对这个世界有多大影响?几乎为零。

这段经历给了他一个深刻的教训:要做有客观评价标准的事,要做对世界能产生影响的事。

所以当他来到AI领域之后,反而觉得轻松了。

不是说AI简单到不用学,而是AI有一个物理学梦寐以求的东西:你可以做实验。

你有一个想法,写成代码,跑一下,看结果。不行就调,调完再跑。

这个反馈循环在高能物理里是不存在的。

AI的可验证性,恰恰是它能飞速发展的原因。

2

现在很多人喜欢造神,今天这个研究员身价千万,明天那个科学家被天价挖角。

姚顺宇对这件事的态度非常明确:所有给个人贴金的事,都有点炒作的嫌疑。

他参与了Claude 3.7的开发,这是Anthropic后训练的一个分水岭。

但他描述自己工作的方式是这样的:我自己对那个事没那么重要,更多的是我很幸运,有机会在那个时候加入了一个重要的项目,做了一些事。

在他看来,在Transformer这个范式被发现之前,确实需要某个人或某个小团体做出关键突破。

那个阶段可能存在英雄。

一旦范式确立,进入规模化阶段之后,大部分想法变得非常朴素。

谁都能想、谁都能干,只是你运气好撞着这个机会。

真正决定成败的,不是某个人的灵光一闪,而是一个集体能不能一起工作,能不能为了一个目标投入时间和精力。

他提到Anthropic之所以能在coding方向上押对注,不是因为某个天才想到了这件事,而是因为Claude 3发布之后,用户在社交媒体上反馈说它写代码比GPT-4强。

公司迅速捕捉到这个信号,立刻全力投入。这个过程靠的是组织的反应速度,不是某个人的先见之明。

同理,他觉得AI研究员被炒到天价有点过分了。

市场稀缺是真的,因为能接触到前沿训练环境的人确实不多。但这种稀缺是机会造成的,不是智力造成的。

3

在Anthropic待了一年,在Google DeepMind也待了大半年,姚顺宇对两家公司的观察挺有意思。

Anthropic的核心优势是执行力。

它能做到自上而下地快速决策,原因很独特:技术领导人本身就是公司联合创始人。

像Jared Kaplan和Sam McCandlish,他们既懂技术又能拍板,不需要层层汇报。

而且整个创始团队没有一个人离开过公司,这批人是从OpenAI一起出来的,在Scaling Law和GPT-3这些关键论文上都是共同作者,互相之间有深厚的信任。

他特别提到一点:实行自上而下有一个很难的地方,就是做技术决策的人,必须同时也是公司的决策人。

技术一号位要有公信力,CEO又不能成为阻力,这两个条件同时满足很罕见。

Google则完全是另一套玩法,它是大公司,传统上更自下而上。

但Google的强项在于,当一件事变成确定性的工程项目时,它的工程管理能力碾压式地强。

预训练现在就进入了Google的舒适区,组织架构非常清楚,谁负责什么一目了然。

Gemini能追上来靠的是两件事的叠加:Nano Banana把用户量打起来了,Gemini 3紧接着把人留住了。

如果只有模型好但没有用户基础,传播速度太慢。

他有一个很犀利的判断:从某种意义上说,OpenAI救了Google一命。

OpenAI率先做了聊天机器人,让Google意识到了威胁。但OpenAI又没有把搜索彻底干掉,留给了Google反击的时间窗口。

4

聊到招人,姚顺宇的标准出乎意料。

他设计过一道面试题:给候选人24小时,从零开始完成一个强化学习项目。告诉你有什么资源,自己选模型、选数据、选算法,做出来。24小时后有一个小时的讨论。

这道题考的不是代码能力,真正考的是两件事:你能不能有效地跟AI协作?以及,你有没有真正理解AI帮你做了什么?

如果你全盘扔给AI,自己不去理解过程,一个小时的讨论里一定会露馅。

设计成24小时,还有一层用意:看你有多看重这个机会。

能熬住的人,至少态度是到位的。

他反复强调的核心特质就一个词:靠谱。做事细致,对自己做的事负责任。

5

姚顺宇现在的工作重心是两个方向:ML coding,就是让AI能自己完成完整的研究流程;以及long horizon,让模型能处理更长时间跨度的任务。

他对long horizon的思考很有意思。

人的上下文窗口其实非常短,你现在问我昨天晚上吃什么,我一点也想不起来。

但人能选择性遗忘、选择性检索,把跟当前场景相关的信息抓回来。

模型也应该学会这件事,用短的上下文训练,但能做长上下文的事。

他坦言自己不会在Google待很久,还想继续折腾,但前提是得找到一个值得折腾的事。

最后他说了一段话,我觉得适合所有在这个行业里的人听听:你不用太担心因为自己的观点而惹到什么人。只要你的观点是自洽的,不是随便喷人,你有一套自己的理解。

最终你在这个领域做得怎样,是有客观评价标准的。