深度解读DeepSeek V4,看清Benchmark之外的三个范式级创新
如果 transformer 架构不变,大模型就是数字超级工程,竞争基本就等同于奥数团体赛,奖金大概就是是万亿美金以上的量级。
人数高一个数量级的中国奥数军团们正在蜂拥而至,他们历经中国式教育的魔鬼训练,聪明,抗压,有经验,有欲望。
训练模型的算力已经足够了,赶超可能会很快! 网页链接
深度解读DeepSeek V4,看清Benchmark之外的三个范式级创新
如果 transformer 架构不变,大模型就是数字超级工程,竞争基本就等同于奥数团体赛,奖金大概就是是万亿美金以上的量级。
人数高一个数量级的中国奥数军团们正在蜂拥而至,他们历经中国式教育的魔鬼训练,聪明,抗压,有经验,有欲望。
训练模型的算力已经足够了,赶超可能会很快! 网页链接