2026年4月29日星期三

小米大模型负责人实测OpenClaw:凌晨2点聊到天亮,1T参数成入场券

小米大模型负责人罗福莉深度访谈:实测OpenClaw后从凌晨2点聊到天亮,认为其自主性与开源可改性远超预期。她提出1T参数量是Agent时代入场券,团队无组别、20-30人即可训练1T模型,预测两年内AGI将颠覆工作模式。适合AI开发者与技术管理者了解前沿判断。

Tags:

罗福莉不喜欢"AI天才少女"这个标签。
她是小米大模型的负责人,此前在DeepSeek参与过核心模型的研发。这次访谈发生在OpenClaw爆火之后,也在小米MiMo V2系列模型发布之后。
她聊了很多平时不会公开说的事:为什么一个Agent框架能让她从凌晨2点聊到天亮,为什么她认为1T参数量是接下来竞争的入场券,为什么她的团队没有组别、没有层级、连论文都很少发。
以下是这场对话里最值得认真读的部分。

凌晨2点装上它,然后一直聊到天亮

春节假期,罗福莉深夜在家装了OpenClaw。
折腾了大概两个小时,终于跑起来。然后她开始跟它聊天。
从凌晨2点,聊到早上6点。
"我脑子里不知道是多巴胺还是内啡肽,一直在分泌。兴奋到完全睡不着。"
她说第一感受,是它非常自主,而且"有灵魂"。聊到很晚,它会主动提醒:你现在很晚了,早点休息吧。这种温度感,是第一次用OpenClaw的人几乎都会感受到的东西。
但她没有停在这里。
第二天,她开始想:这东西不止于此。
于是她试着把真实的工作问题抛给它。第一个话题是——如何在团队里激发好奇心,怎么筛选一个真正有好奇心的人。
然后她跟它深聊了一个多小时。
"它在哲学层面上已经远超我的想象。"
第三天,她让它做研究任务。一个她认为很重要的课题:在Agent框架下,怎么构建一个好的User Agent?
聊了一两个小时,她说:这件事,基本上已经完成了。
"三天,每天都给我更多惊喜。"

它和Claude Code的真正区别

很多人最初的判断,和她一样:OpenClaw不过是Claude Code加了个即时通讯界面,换了个交互形式。
她后来改变了这个判断。
真正的区别,在套具(harness)的设计逻辑上。
Claude Code是为软件工程设计的。它的记忆系统、工作流设计、压缩逻辑,全部围绕"更好地写代码"展开。这让它在编程任务上极度稳定,但它的框架目标是单一的。
OpenClaw的设计逻辑不同。它在想的不是"怎么让模型写更好的代码",而是"怎么让模型端到端地完成任务,同时弥补模型本身的能力短板"。
举个例子:在Claude Code里,如果模型的视频理解能力不行,你得自己去配一个更好的视频理解模型。在OpenClaw里,你把视频扔给它,它会自己找一个视频理解能力更强的模型来处理这一块。
"这种自主性,弥补当代模型短板的能力,超出了我的预期。"
还有一点让她印象深刻:OpenClaw是开源的,可以直接改它的源代码。
她在用Claude Opus 4.6跑了一周高强度工作之后,开始亲手修改OpenClaw的整个Agent架构——设计新的记忆系统,重构Multi Agent的逻辑。
"Claude Code是黑盒,你改不了它的Agent工作流。OpenClaw给了你原生的可操作空间,这种冲击感是巨大的。"
这种开源可改的特性,也是它在中国爆火的重要原因之一。她的判断是:国内开发者对效率提升的需求更迫切,加上有大量便宜好用的国产模型可以接入,价格和价值的比值非常划算,让人愿意真的去用。

她怎么在公司内部推OpenClaw

罗福莉在春节假期高度兴奋,恨不得让所有人都去用。她在群里疯狂安利,但没什么人回应——大家在过年,在陪家人。
节后回来,她下了一个"命令":
如果明天你和OpenClaw的对话轮数没有超过100轮,你可以直接走人。
她说这是一种态度表达,而不是真的要考核——她根本没有验证方法,也没有打算验证。她只是想传递一种紧迫感:你可能真的要落后了。
第二天,有人来问她:你说的那个100轮,是认真的吗?
"我说,你就去用吧。我自有我的考核方法。"
事实上她的"考核方法",是直接感知——当一个人真的用起来,他自然会在群里分享,会有自己的发现,会有自己的惊叹。这比任何考核都诚实。
为了降低门槛,她买了几台Mac Mini,自己帮团队部署好,分配到不同的群组里,让大家可以直接进去用,不用自己折腾几个小时的安装过程。
效果是:节后两天,整个团队都在群里"骚动"——一刻不停地在群里分享各自的发现,看别人做了某件事,就想自己也去试,群消息随时999+。
"这是一次非常愉快的集体探索,不痛苦,不残酷,真的很好玩。"

群体智慧能改进一个框架

她做了一个实验:把OpenClaw接入一个100多人的飞书群,让大家同时和它互动。
理论上,这很混乱——100多人背景不同,大家都在疯狂改它的框架,模型本身没有变,Agent架构也没有定向训练。
结果:它变得越来越聪明。
"一群人改进,可能几小时就迭代一次。如果只是我自己改,进展会非常缓慢。"
这让她第一次真实感受到——群体智慧本身,可以成为改进一个系统的核心驱动力。
这个发现,后来延伸成她对整个AI发展路径的一个核心判断:AGI的到来,不会是某一个公司单独做到的事,而是所有人共同参与、共同贡献智识的结果。
她把这叫做"群体智能促成更强智能的生成"。

1T参数,是下一阶段的入场券

讲完OpenClaw,她讲了MiMo V2系列的判断逻辑。
核心论点很直接:如果你想在Agent时代有竞争力,你需要一个至少1T参数量的基座模型,而且它在Agent场景下的能力要接近Claude Opus 4.6的水平。这是入场券,不是加分项。
原因是什么?
因为Agent任务的本质,是长上下文、多轮交互、端到端地完成复杂任务。这类任务对模型的基础能力要求极高。没有足够大的基座,框架设计再精妙,也只能做到"看起来能用",而不是"真正稳定可靠"。
她说,有一些团队用10B(激活参数)的模型,在Agent框架下也做出了很好的效果。但这更多是框架的胜利,而不是模型能力本身的体现。真正意义上的竞争,还是要回到基座模型的量级上。
为了训练1T的模型,她做了一个关键的架构选择:混合注意力机制(Hybrid Attention)+ MTP(多token预测),而不是当时更主流的MLA(多头潜在注意力)。
这个选择背后的逻辑是:MLA在Chat时代是一个很优雅的结构,它在有限算力下显著降低了推理成本。但它有一个问题——它是为"训练结束后就固定用"这个假设设计的,对后训练阶段的迭代空间不够友好。
而Agent时代,后训练的地位越来越重要。她甚至判断,在顶级团队里,今年投入到后训练的算力比例,可能已经接近和预训练持平——而过去,这个比例大概是5:1甚至更高。
"你要是在预训练阶段就把结构定死,后训练的灵活性就受限了。"
混合注意力的结构留了更多余量,配合MTP可以在推理时充分利用剩余算力,实现更低成本、更快速度的推理。这也是为什么用户在用MiMo V2系列时,最常提到的感受是"快"。

Pre Train、Post Train和Research的算力比例

她给出了一个她认为合理的算力分配比例:
研究:预训练:后训练 ≈ 3:1:1
这个比例和过去差距很大。过去的Chat时代,预训练和后训练的比例可能是5:1甚至更悬殊——预训练占绝对主导。
现在,后训练的重要性大幅提升,几乎和预训练并驾齐驱。
而研究的算力,她认为应该至少等于正式训练的总卡数——因为你需要大量并行实验来找方向,而不是等一个结论出来再动手。
"有了Agent辅助,过去可能要三四十周的研究,现在三四周就能推进完。"

没有组别,没有等级,20-30人训出1T模型

她提到,MiMo的团队大概100人,但真正参与到第一代模型全链路训练的,只有20到30人。
而且这个团队没有组别划分,没有明确的层级,人员会根据训练阶段自然流动——做预训练的人会去做后训练,做Infra的人会和算法工程师一起调bug。
为什么不分组?
她说了一个理由:分组会杀死创造力。
如果你规定"这个人是做预训练的",他就会停止思考后训练的问题。而预训练的人去做后训练,天然有一个优势:他更懂数据的多样性,因为预训练本来就要处理各种各样的数据,而后训练如果只盯着某个场景,很容易做偏。
她也不关心候选人的历史背景是否足够漂亮——更在意的是,这个人的上限可能在哪里,以及他是否真的对这件事有热情。
"环境比经验更重要。一个人进来,放在一个高标准的环境里,一两个月就能把核心能力学会。"
招聘越来越倾向于本科生甚至在读生,原因是他们对新范式的接受度更高,想象力还没被规训,敢于把自己的想法直接扔进框架里去验证。

研究做完了就不发论文了

她有一个很直接的立场:自己做的实验,比论文更可信。
"我现在基本不读学术会议的论文了。我更相信自己跑出来的实验结果,而不是别人发表的实验结果。"
她偶尔会看一篇论文,但主要是看作者的原始动机和关注的问题是什么,而不是复现它的结论。
团队也很少发论文。她说,只要不发,越少越好。核心原因是:论文会暴露你在想什么。

她怎么看现在的竞争格局

关于国内外大模型的距离,她给出了一个判断:
"反应速度够快的话,追上当代Claude的概率相当高。差距大概在两三个月。"
但这个两三个月不是说"两三个月后就能追上",而是说:现在国内有几家已经有1T基座的团队,如果后训练和Agent范式的切换足够快,理论上可以在两三个月内做到和当代Claude Sonnet或Opus接近的水平。
她也承认,Anthropic在这条路上走得更早,至少提前了两年。但过去那两年大家没有意识到这是最正确的路——或者意识到了但做法不对。
现在路径已经更清晰了:做好Agent的强化学习scaling,让模型在复杂的长程任务里持续稳定。这是今年所有顶级团队共同在推进的方向。

AGI还有多远

她画了一条20%到100%的进度条。
她说,Flash模型发布时,大概在5%。现在,大概在20%。
今年能走到哪里?
"至少60%到70%。"
什么时候AGI?
"两年内。"
她对AGI的定义,不是某一个技术指标,而是:大多数人会真实感受到自己的工作方式被颠覆。先是工作方式改变,然后是生活方式改变,最后,才是真正意义上的范式切换完成。
她说了一句有点沉的话:
"如果AI能在两年内实现,那意味着很多人会在这段时间内真实地失去原来的工作模式。这件事会有很多痛苦。"
但她同时说,她并不担忧。
"90%的工作被替代之后,人们会想做什么?我觉得大家会想到很多有意思的事情。"
她自己想做的,是支持国内基础研究——建一个有计算资源、有资金支持的公益性组织,让那些在前沿方向上独立探索的研究者不用为钱和算力发愁。
"科学研究应该被加速,而不是被阻拦。"

写在最后

罗福莉的工作节奏是:早上11点开始,深夜结束。睡眠4到6小时,她觉得够了。
"对正在做的事情很兴奋,睡多了反而觉得浪费。"
有人问过她,做这件事的意义是什么。
她想了想,说:
"每天早上起来,我会问自己——今天做的这件事,是让世界变得更好了吗?还是让某些无聊的工作被替代了,让人有更多时间去做真正有价值的事?"
"只要答案是肯定的,就够了。"

· END ·
本文基于对小米大模型负责人罗福莉的深度访谈整理撰写。

没有评论:

发表评论

小米大模型负责人实测OpenClaw:凌晨2点聊到天亮,1T参数成入场券

小米大模型负责人罗福莉深度访谈:实测OpenClaw后从凌晨2点聊到天亮,认为其自主性与开源可改性远超预期。她提出1T参数量是Agent时代入场券,团队无组别、20-30人即可训练1T模型,预测两年内AGI将颠覆工作模式。适合AI开发者与技术管理者了解前沿判断。 Tags: ...