雷军回应大模型火了 相比于之前的309B(激活15B)的MoE模型MiMo V2,这次的V2 Pro总参数规模突破1万亿(1T),其中激活参数为42B。V2 Pro采用改进后的混合注意力机制,在保证推理效率的同时大幅提升模型容量。其上下文窗口进一步扩展至100万Token,可以支持超长任务链和复杂工作流。
小米对MiMo V2 Pro的定义就是“面向Agent时代的旗舰基座大模型”,相比于之前的只能对话和处理简单任务,这次它升级为了“Agent系统的大脑”,能够主动去理解任务、然后主动调用工具,再去执行多步骤流程,最后实现交付。
在收费这一块,目前是限时一周免费。
后续采用分段收费的模式:在256K上下文范围内,输入与输出单价分别为1美元和3美元(每百万Token);若使用1百万长上下文,费率则上浮至输入2美元、输出6美元。
这个价格明显是要比几个竞品低的,小米也希望利用这种性价比策略来吸引更多开发者,尤其是“缓存写入暂时免费”这一点,对于需要频繁调用长上下文提示词的Agent开发者而言,将极大地降低运行成本。





