昊梵体育网

说真的,看到小米这次 MiMo-V2.5‑Pro UltraSpeed 的数据,

说真的,看到小米这次 MiMo-V2.5‑Pro UltraSpeed 的数据,还是挺惊讶的。万亿参数大模型,推理速度直接干到 1000 tokens/s,峰值接近1200,而且是在普通8卡通用GPU上跑出来的,不用定制芯片。

对比一下就更直观了:主流大模型大多在几十到两百 tokens/s,平时用总感觉要等,而小米这次几乎做到了和人思考同步。复杂任务比如生成可视化大屏,别人要六七分钟,它十几秒就搞定。

不是营销那种“遥遥领先”,而是实打实的工程优化,把速度拉到了新高度。对普通用户来说,最直接的感受就是:AI 不再是你等它,而是它跟上你的节奏,用起来会顺很多。小米大模型刷新全球最快推理速度