有消息称,美团即将发布一个万亿级别规模的新模型。更关键的是,这个模型不是跑在常规海外算力上,而是在5万卡级别的国产超大集群上训练出来的。
如果这个说法属实,它可能就是目前已知在纯国产卡上训练的最大规模模型。
现在模型已经上了官网longcat.chat,有限时免费内测,每天发1000万token额度,还挺大气。
几个信息点放在一起看,还是挺有分量的:
一个是可支持1M上下文。
另一个是Agent场景表现不错。
这些放在美团身上,其实挺合理。
美团的业务本来就是复杂任务场景,外卖、到店、酒旅、即时零售,每一条链路都是多步骤、多系统、多角色协同。
所以美团做大模型,重点是让模型真正进入业务流程。
长文本能处理复杂信息,Agent能拆解任务、调用工具、完成链路,这些能力放到美团的场景里,想象空间就打开了。
这次看点除了美团做了个大模型。
也是美团在用一个万亿级模型,验证国产算力能不能支撑真正的大规模训练。
如果后面正式发布,行业估计要重新看一眼美团的AI牌了。

