早上骑车上班,继续听张小珺对姚顺宇(Anthropic前研究员)的采访,听到挺有意思的细节。
姚顺宇刚进入 Anthropic 的时候,Anthropic 意识到 coding 这件事情从技术角度可以做得很强,早期3.5的版本已经体现出比ChatGPT还强的能力。
姚顺宇进入这家公司之后,团队通过实践的方式提升了 Anthropic 的 coding 能力,而核心方法在于【大尺度的强化学习】。

早上骑车上班,继续听张小珺对姚顺宇(Anthropic前研究员)的采访,听到挺有意思的细节。
姚顺宇刚进入 Anthropic 的时候,Anthropic 意识到 coding 这件事情从技术角度可以做得很强,早期3.5的版本已经体现出比ChatGPT还强的能力。
姚顺宇进入这家公司之后,团队通过实践的方式提升了 Anthropic 的 coding 能力,而核心方法在于【大尺度的强化学习】。
