看了张小珺发的播客，感觉姚顺宇真的是一个很有意思的人。清华本科学物理，斯坦福博士

看了张小珺发的播客，感觉姚顺宇真的是一个很有意思的人。

清华本科学物理，斯坦福博士读高能物理，研究的是量子场论和弦论。

结果博士毕业之后，他直接彻底离开物理，转行做AI了。

先去了Anthropic，参与了Claude 3.7和4.5的开发；然后又跳到了Google DeepMind，赶上了Gemini 3。

两年时间，把两家顶尖AI公司的核心项目都经历了一遍。

但我觉得很值得聊聊的，是他说话的方式。

他说：AI个人英雄主义时代已经过去了。

姚顺宇本科在清华做的是凝态理论，很快就做出了范式级的学术成果。

按正常剧本，他应该继续在物理领域深耕。但他偏偏选了一条更难的路，博士去斯坦福读高能物理。

高能理论有多难呢？这么说吧，这个方向发展到今天，实验已经完全追不上理论了。

你提出一个框架，没有办法用实验去验证它。判断你做得好不好，很大程度上依赖于领域里一些权威人物的主观判断。

他在博士期间的体会是：从外界标准看，我的论文没人说不好。

但摸着良心说，对这个世界有多大影响？几乎为零。

这段经历给了他一个深刻的教训：要做有客观评价标准的事，要做对世界能产生影响的事。

所以当他来到AI领域之后，反而觉得轻松了。

不是说AI简单到不用学，而是AI有一个物理学梦寐以求的东西：你可以做实验。

你有一个想法，写成代码，跑一下，看结果。不行就调，调完再跑。

这个反馈循环在高能物理里是不存在的。

AI的可验证性，恰恰是它能飞速发展的原因。

现在很多人喜欢造神，今天这个研究员身价千万，明天那个科学家被天价挖角。

姚顺宇对这件事的态度非常明确：所有给个人贴金的事，都有点炒作的嫌疑。

他参与了Claude 3.7的开发，这是Anthropic后训练的一个分水岭。

但他描述自己工作的方式是这样的：我自己对那个事没那么重要，更多的是我很幸运，有机会在那个时候加入了一个重要的项目，做了一些事。

在他看来，在Transformer这个范式被发现之前，确实需要某个人或某个小团体做出关键突破。

那个阶段可能存在英雄。

一旦范式确立，进入规模化阶段之后，大部分想法变得非常朴素。

谁都能想、谁都能干，只是你运气好撞着这个机会。

真正决定成败的，不是某个人的灵光一闪，而是一个集体能不能一起工作，能不能为了一个目标投入时间和精力。

他提到Anthropic之所以能在coding方向上押对注，不是因为某个天才想到了这件事，而是因为Claude 3发布之后，用户在社交媒体上反馈说它写代码比GPT-4强。

公司迅速捕捉到这个信号，立刻全力投入。这个过程靠的是组织的反应速度，不是某个人的先见之明。

同理，他觉得AI研究员被炒到天价有点过分了。

市场稀缺是真的，因为能接触到前沿训练环境的人确实不多。但这种稀缺是机会造成的，不是智力造成的。

在Anthropic待了一年，在Google DeepMind也待了大半年，姚顺宇对两家公司的观察挺有意思。

Anthropic的核心优势是执行力。

它能做到自上而下地快速决策，原因很独特：技术领导人本身就是公司联合创始人。

像Jared Kaplan和Sam McCandlish，他们既懂技术又能拍板，不需要层层汇报。

而且整个创始团队没有一个人离开过公司，这批人是从OpenAI一起出来的，在Scaling Law和GPT-3这些关键论文上都是共同作者，互相之间有深厚的信任。

他特别提到一点：实行自上而下有一个很难的地方，就是做技术决策的人，必须同时也是公司的决策人。

技术一号位要有公信力，CEO又不能成为阻力，这两个条件同时满足很罕见。

Google则完全是另一套玩法，它是大公司，传统上更自下而上。

但Google的强项在于，当一件事变成确定性的工程项目时，它的工程管理能力碾压式地强。

预训练现在就进入了Google的舒适区，组织架构非常清楚，谁负责什么一目了然。

Gemini能追上来靠的是两件事的叠加：Nano Banana把用户量打起来了，Gemini 3紧接着把人留住了。

如果只有模型好但没有用户基础，传播速度太慢。

他有一个很犀利的判断：从某种意义上说，OpenAI救了Google一命。

OpenAI率先做了聊天机器人，让Google意识到了威胁。但OpenAI又没有把搜索彻底干掉，留给了Google反击的时间窗口。

聊到招人，姚顺宇的标准出乎意料。

他设计过一道面试题：给候选人24小时，从零开始完成一个强化学习项目。告诉你有什么资源，自己选模型、选数据、选算法，做出来。24小时后有一个小时的讨论。

这道题考的不是代码能力，真正考的是两件事：你能不能有效地跟AI协作？以及，你有没有真正理解AI帮你做了什么？

如果你全盘扔给AI，自己不去理解过程，一个小时的讨论里一定会露馅。

设计成24小时，还有一层用意：看你有多看重这个机会。

能熬住的人，至少态度是到位的。

他反复强调的核心特质就一个词：靠谱。做事细致，对自己做的事负责任。

姚顺宇现在的工作重心是两个方向：ML coding，就是让AI能自己完成完整的研究流程；以及long horizon，让模型能处理更长时间跨度的任务。

他对long horizon的思考很有意思。

人的上下文窗口其实非常短，你现在问我昨天晚上吃什么，我一点也想不起来。

但人能选择性遗忘、选择性检索，把跟当前场景相关的信息抓回来。

模型也应该学会这件事，用短的上下文训练，但能做长上下文的事。

他坦言自己不会在Google待很久，还想继续折腾，但前提是得找到一个值得折腾的事。

最后他说了一段话，我觉得适合所有在这个行业里的人听听：你不用太担心因为自己的观点而惹到什么人。只要你的观点是自洽的，不是随便喷人，你有一套自己的理解。

最终你在这个领域做得怎样，是有客观评价标准的。

昊梵体育网

看了张小珺发的播客，感觉姚顺宇真的是一个很有意思的人。清华本科学物理，斯坦福博士

热门分类