昊梵体育网

昨天晚上小米闷声憋了个大的,一口气发了三个大模型,都属于Xiaomi MiMo,

昨天晚上小米闷声憋了个大的,一口气发了三个大模型,都属于Xiaomi MiMo,分别是:Pro、Omni、TTS,如何评价?

我只能用夯到爆来形容!!!!!

前几天火爆AI圈的Hunter Alpha也被证实就是MiMo-V2-Pro的测试版本,这玩意在无任何推广的情况下口碑逆天,使用率直接干到了开源社区第一。

然后再来说下这次三个大模型的区别和优势:

V2-Pro,算是小米现在的旗舰大模型,参数量比较大,但推理能力最强,写代码多轮对话能力非常强,这一点Hunter Alpha爆火已经证实了。

V2-Omni,也是一个全模态的模型,但我觉得更专注于感知和执行这块儿,尤其是对于音视频的深度理解做的非常好。

目前大部分模型都无法理解视频,总结视频的方式基本上都是通过扒字幕,而Omni可以通过音频深度理解甚至单帧分析来理解视频,还能自动寻找素材帮你合成视频,以及各种办公场景的PDF、文件处理等。

所以对大部分人来讲,Omni应该是最实用的,也是我强烈推荐大家去尝试的大模型,现阶段免费,这时候不用,什么时候用?

V2-TTS,更专注语音合成领域,它可以做各种不同的AI音频,整体风格到局部情绪都能精准调节。

另外这次miclaw也有非常重要的升级,我觉得现在这个版本能够看出一些小米对这玩意儿的规划了。

一个是即时通讯模块,后面miclaw可以添加好友、聊天,甚至建群,相当于米聊以另一种方式回归了!

然后是多设备同步,这意味着miclaw后续一定会在你的各种小米设备上同步,包括手机平板汽车,到时候肯定会有更多的玩法。

看完这次小米的发布的模型,我才理解了一点雷军的思路,很明显小米现在就是想通过AI重新拿到下一个计算时代的船票。

因为现如今的小米已经有无数的设备接入,硬件层面早已成生态,唯一缺乏的就是软件部分,而现在AI就是那一把开启一切的钥匙。

或者这么说,小米真正的护城河已经来了。