12月17日,小米在“人车家全生态”合作伙伴大会上扔出一记重磅消息:自研AI大模型Xiaomi MiMo-V2-Flash正式开源。而站在台前解读的,正是今年才加入小米、却早已声名在外的95后AI负责人——罗福莉。

她一登台,就抛出一个鲜明观点:AGI(通用人工智能)的未来在物理世界,而不只靠文本。用她的话说,真正的智能必须是“具身的、嵌入环境的、通过与物理世界持续交互而涌现的”。这也直接定义了小米AI的路线——不做纯数字世界的AI,要做能连接、感知并交互物理世界的AI。
95后“天才少女”,为何被雷军千万挖角?
罗福莉的出场,无疑是本次大会的最大看点之一。这位95后本科毕业于北师大,硕士毕业于北大计算语言学研究所,在学期间就在ACL等顶会上发表过多篇论文。她先后在阿里达摩院、幻方量化(DeepSeek母公司)任职,参与研发了VECO、AliceMind、DeepSeek-V2等知名模型。

2024年底,媒体曝出雷军亲自挖角、以千万级年薪将罗福莉招入小米,一度登上热搜。直到今年11月,她才在社交媒体确认加入小米Mimo团队。而这次登台,是她在小米的首次公开亮相。
“小模型,大能力”:MiMo-V2-Flash什么来头?
罗福莉介绍,此次开源的MiMo-V2-Flash是一个“非常小”的模型——总参数309B,激活参数仅15B,但在多项评测中,性能却超过了参数量更大的DeepSeek V3.2等模型。她自信表示:“它的代码能力,在我看已进入全球 top 2。”
该模型采用3层MTP推理加速技术,实现2.0-2.6倍的推理提速,突出低成本、高速度,并已初步具备“模拟世界”的能力。目前模型已在Hugging Face开源,采用MIT协议,支持联网搜索与深度思考。

小米总裁卢伟冰将其定义为“迈向Agent时代的语言基座”。而它的根本任务,是成为小米“人车家”生态的智能大脑,嵌入手机、汽车、家居等终端,实现无缝联动的体验。
小米大模型战略,静悄悄转弯
小米做大模型其实并不晚。2023年8月,雷军就宣布全面拥抱大模型,当时主力模型是MiLM系列,主打轻量化与端侧部署。但到2024年底,随着罗福莉入职,小米的大模型重心已从MiLM逐步转向MiMo。
2025年以来,小米以MiMo之名已推出一系列模型,覆盖视觉、音频、具身智能等方向。罗福莉透露,下一代基座模型将扩大参数规模、拓展上下文长度,并实现文本、视觉、音频的原生多模态融合,目标直指物理世界的感知与推理。
务实路线:不为做大模型而做,为人车家而做
与其他互联网巨头不同,小米做AI的落脚点始终在硬件生态。截至当前,小米全球月活用户达7.42亿,AIoT平台连接设备数突破10.4亿。因此,MiMo的核心逻辑是“端侧优先”——通过极致优化,把能力塞进手机和车机,在资源受限的设备上跑出高效体验。
这也解释了为什么小米特别强调“物理世界AI”。当AI必须与汽车、家居、手机深度结合,其对真实环境的感知与交互能力,就成为关键差异点。
一边补课,一边长跑
从挖角罗福莉,到持续推出自研模型,小米正在AI领域加速补课。与此同时,小米也在芯片、操作系统等硬核技术上持续投入。卢伟冰在会上重申,小米2025年研发投入预计达320-330亿元,2026年约400亿,未来五年总投入将达2000亿,目标是成为“全球硬核科技的引领者”。
不过,资本市场似乎还在观望。大会后小米股价并未明显回升,某种程度上也反映出,从技术发布到市场认可,小米仍需时间证明自己。
小结
小米这一波AI,走的是一条软硬结合、端侧优先、紧扣场景的务实路线。不追求参数上的庞然大物,而要做一个能落地在千万设备中的“智能灵魂”。重金投入、人才就位、方向清晰,但AI竞赛是一场长跑,小米能否真正跑通“人车家全生态”的智能未来,仍需时间和产品来验证。
