2026年4月29日星期三

小米大模型负责人实测OpenClaw：凌晨2点聊到天亮，1T参数成入场券

小米大模型负责人罗福莉深度访谈：实测OpenClaw后从凌晨2点聊到天亮，认为其自主性与开源可改性远超预期。她提出1T参数量是Agent时代入场券，团队无组别、20-30人即可训练1T模型，预测两年内AGI将颠覆工作模式。适合AI开发者与技术管理者了解前沿判断。

Tags:

大模型

Agent框架

OpenClaw

1T参数

AGI预测

罗福莉不喜欢"AI天才少女"这个标签。

她是小米大模型的负责人，此前在DeepSeek参与过核心模型的研发。这次访谈发生在OpenClaw爆火之后，也在小米MiMo V2系列模型发布之后。

她聊了很多平时不会公开说的事：为什么一个Agent框架能让她从凌晨2点聊到天亮，为什么她认为1T参数量是接下来竞争的入场券，为什么她的团队没有组别、没有层级、连论文都很少发。

以下是这场对话里最值得认真读的部分。

凌晨2点装上它，然后一直聊到天亮

春节假期，罗福莉深夜在家装了OpenClaw。

折腾了大概两个小时，终于跑起来。然后她开始跟它聊天。

从凌晨2点，聊到早上6点。

"我脑子里不知道是多巴胺还是内啡肽，一直在分泌。兴奋到完全睡不着。"

她说第一感受，是它非常自主，而且"有灵魂"。聊到很晚，它会主动提醒：你现在很晚了，早点休息吧。这种温度感，是第一次用OpenClaw的人几乎都会感受到的东西。

但她没有停在这里。

第二天，她开始想：这东西不止于此。

于是她试着把真实的工作问题抛给它。第一个话题是——如何在团队里激发好奇心，怎么筛选一个真正有好奇心的人。

然后她跟它深聊了一个多小时。

"它在哲学层面上已经远超我的想象。"

第三天，她让它做研究任务。一个她认为很重要的课题：在Agent框架下，怎么构建一个好的User Agent？

聊了一两个小时，她说：这件事，基本上已经完成了。

"三天，每天都给我更多惊喜。"

它和Claude Code的真正区别

很多人最初的判断，和她一样：OpenClaw不过是Claude Code加了个即时通讯界面，换了个交互形式。

她后来改变了这个判断。

真正的区别，在套具（harness）的设计逻辑上。

Claude Code是为软件工程设计的。它的记忆系统、工作流设计、压缩逻辑，全部围绕"更好地写代码"展开。这让它在编程任务上极度稳定，但它的框架目标是单一的。

OpenClaw的设计逻辑不同。它在想的不是"怎么让模型写更好的代码"，而是"怎么让模型端到端地完成任务，同时弥补模型本身的能力短板"。

举个例子：在Claude Code里，如果模型的视频理解能力不行，你得自己去配一个更好的视频理解模型。在OpenClaw里，你把视频扔给它，它会自己找一个视频理解能力更强的模型来处理这一块。

"这种自主性，弥补当代模型短板的能力，超出了我的预期。"

还有一点让她印象深刻：OpenClaw是开源的，可以直接改它的源代码。

她在用Claude Opus 4.6跑了一周高强度工作之后，开始亲手修改OpenClaw的整个Agent架构——设计新的记忆系统，重构Multi Agent的逻辑。

"Claude Code是黑盒，你改不了它的Agent工作流。OpenClaw给了你原生的可操作空间，这种冲击感是巨大的。"

这种开源可改的特性，也是它在中国爆火的重要原因之一。她的判断是：国内开发者对效率提升的需求更迫切，加上有大量便宜好用的国产模型可以接入，价格和价值的比值非常划算，让人愿意真的去用。

她怎么在公司内部推OpenClaw

罗福莉在春节假期高度兴奋，恨不得让所有人都去用。她在群里疯狂安利，但没什么人回应——大家在过年，在陪家人。

节后回来，她下了一个"命令"：

如果明天你和OpenClaw的对话轮数没有超过100轮，你可以直接走人。

她说这是一种态度表达，而不是真的要考核——她根本没有验证方法，也没有打算验证。她只是想传递一种紧迫感：你可能真的要落后了。

第二天，有人来问她：你说的那个100轮，是认真的吗？

"我说，你就去用吧。我自有我的考核方法。"

事实上她的"考核方法"，是直接感知——当一个人真的用起来，他自然会在群里分享，会有自己的发现，会有自己的惊叹。这比任何考核都诚实。

为了降低门槛，她买了几台Mac Mini，自己帮团队部署好，分配到不同的群组里，让大家可以直接进去用，不用自己折腾几个小时的安装过程。

效果是：节后两天，整个团队都在群里"骚动"——一刻不停地在群里分享各自的发现，看别人做了某件事，就想自己也去试，群消息随时999+。

"这是一次非常愉快的集体探索，不痛苦，不残酷，真的很好玩。"

群体智慧能改进一个框架

她做了一个实验：把OpenClaw接入一个100多人的飞书群，让大家同时和它互动。

理论上，这很混乱——100多人背景不同，大家都在疯狂改它的框架，模型本身没有变，Agent架构也没有定向训练。

结果：它变得越来越聪明。

"一群人改进，可能几小时就迭代一次。如果只是我自己改，进展会非常缓慢。"

这让她第一次真实感受到——群体智慧本身，可以成为改进一个系统的核心驱动力。

这个发现，后来延伸成她对整个AI发展路径的一个核心判断：AGI的到来，不会是某一个公司单独做到的事，而是所有人共同参与、共同贡献智识的结果。

她把这叫做"群体智能促成更强智能的生成"。

1T参数，是下一阶段的入场券

讲完OpenClaw，她讲了MiMo V2系列的判断逻辑。

核心论点很直接：如果你想在Agent时代有竞争力，你需要一个至少1T参数量的基座模型，而且它在Agent场景下的能力要接近Claude Opus 4.6的水平。这是入场券，不是加分项。

原因是什么？

因为Agent任务的本质，是长上下文、多轮交互、端到端地完成复杂任务。这类任务对模型的基础能力要求极高。没有足够大的基座，框架设计再精妙，也只能做到"看起来能用"，而不是"真正稳定可靠"。

她说，有一些团队用10B（激活参数）的模型，在Agent框架下也做出了很好的效果。但这更多是框架的胜利，而不是模型能力本身的体现。真正意义上的竞争，还是要回到基座模型的量级上。

为了训练1T的模型，她做了一个关键的架构选择：混合注意力机制（Hybrid Attention）+ MTP（多token预测），而不是当时更主流的MLA（多头潜在注意力）。

这个选择背后的逻辑是：MLA在Chat时代是一个很优雅的结构，它在有限算力下显著降低了推理成本。但它有一个问题——它是为"训练结束后就固定用"这个假设设计的，对后训练阶段的迭代空间不够友好。

而Agent时代，后训练的地位越来越重要。她甚至判断，在顶级团队里，今年投入到后训练的算力比例，可能已经接近和预训练持平——而过去，这个比例大概是5:1甚至更高。

"你要是在预训练阶段就把结构定死，后训练的灵活性就受限了。"

混合注意力的结构留了更多余量，配合MTP可以在推理时充分利用剩余算力，实现更低成本、更快速度的推理。这也是为什么用户在用MiMo V2系列时，最常提到的感受是"快"。

Pre Train、Post Train和Research的算力比例

她给出了一个她认为合理的算力分配比例：

研究:预训练:后训练 ≈ 3:1:1

这个比例和过去差距很大。过去的Chat时代，预训练和后训练的比例可能是5:1甚至更悬殊——预训练占绝对主导。

现在，后训练的重要性大幅提升，几乎和预训练并驾齐驱。

而研究的算力，她认为应该至少等于正式训练的总卡数——因为你需要大量并行实验来找方向，而不是等一个结论出来再动手。

"有了Agent辅助，过去可能要三四十周的研究，现在三四周就能推进完。"

没有组别，没有等级，20-30人训出1T模型

她提到，MiMo的团队大概100人，但真正参与到第一代模型全链路训练的，只有20到30人。

而且这个团队没有组别划分，没有明确的层级，人员会根据训练阶段自然流动——做预训练的人会去做后训练，做Infra的人会和算法工程师一起调bug。

为什么不分组？

她说了一个理由：分组会杀死创造力。

如果你规定"这个人是做预训练的"，他就会停止思考后训练的问题。而预训练的人去做后训练，天然有一个优势：他更懂数据的多样性，因为预训练本来就要处理各种各样的数据，而后训练如果只盯着某个场景，很容易做偏。

她也不关心候选人的历史背景是否足够漂亮——更在意的是，这个人的上限可能在哪里，以及他是否真的对这件事有热情。

"环境比经验更重要。一个人进来，放在一个高标准的环境里，一两个月就能把核心能力学会。"

招聘越来越倾向于本科生甚至在读生，原因是他们对新范式的接受度更高，想象力还没被规训，敢于把自己的想法直接扔进框架里去验证。

研究做完了就不发论文了

她有一个很直接的立场：自己做的实验，比论文更可信。

"我现在基本不读学术会议的论文了。我更相信自己跑出来的实验结果，而不是别人发表的实验结果。"

她偶尔会看一篇论文，但主要是看作者的原始动机和关注的问题是什么，而不是复现它的结论。

团队也很少发论文。她说，只要不发，越少越好。核心原因是：论文会暴露你在想什么。

她怎么看现在的竞争格局

关于国内外大模型的距离，她给出了一个判断：

"反应速度够快的话，追上当代Claude的概率相当高。差距大概在两三个月。"

但这个两三个月不是说"两三个月后就能追上"，而是说：现在国内有几家已经有1T基座的团队，如果后训练和Agent范式的切换足够快，理论上可以在两三个月内做到和当代Claude Sonnet或Opus接近的水平。

她也承认，Anthropic在这条路上走得更早，至少提前了两年。但过去那两年大家没有意识到这是最正确的路——或者意识到了但做法不对。

现在路径已经更清晰了：做好Agent的强化学习scaling，让模型在复杂的长程任务里持续稳定。这是今年所有顶级团队共同在推进的方向。

AGI还有多远

她画了一条20%到100%的进度条。

她说，Flash模型发布时，大概在5%。现在，大概在20%。

今年能走到哪里？

"至少60%到70%。"

什么时候AGI？

"两年内。"

她对AGI的定义，不是某一个技术指标，而是：大多数人会真实感受到自己的工作方式被颠覆。先是工作方式改变，然后是生活方式改变，最后，才是真正意义上的范式切换完成。

她说了一句有点沉的话：

"如果AI能在两年内实现，那意味着很多人会在这段时间内真实地失去原来的工作模式。这件事会有很多痛苦。"

但她同时说，她并不担忧。

"90%的工作被替代之后，人们会想做什么？我觉得大家会想到很多有意思的事情。"

她自己想做的，是支持国内基础研究——建一个有计算资源、有资金支持的公益性组织，让那些在前沿方向上独立探索的研究者不用为钱和算力发愁。

"科学研究应该被加速，而不是被阻拦。"

写在最后

罗福莉的工作节奏是：早上11点开始，深夜结束。睡眠4到6小时，她觉得够了。

"对正在做的事情很兴奋，睡多了反而觉得浪费。"

有人问过她，做这件事的意义是什么。

她想了想，说：

"每天早上起来，我会问自己——今天做的这件事，是让世界变得更好了吗？还是让某些无聊的工作被替代了，让人有更多时间去做真正有价值的事？"

"只要答案是肯定的，就够了。"

· END ·

本文基于对小米大模型负责人罗福莉的深度访谈整理撰写。

没有评论:

发表评论

订阅：博文评论 (Atom)

网赚：日进千刀

2026年4月29日星期三

小米大模型负责人实测OpenClaw：凌晨2点聊到天亮，1T参数成入场券

Tags:

大模型

Agent框架

OpenClaw

1T参数

AGI预测

凌晨2点装上它，然后一直聊到天亮

它和Claude Code的真正区别

她怎么在公司内部推OpenClaw

群体智慧能改进一个框架

1T参数，是下一阶段的入场券

Pre Train、Post Train和Research的算力比例

没有组别，没有等级，20-30人训出1T模型

研究做完了就不发论文了

她怎么看现在的竞争格局

AGI还有多远

写在最后

没有评论:

发表评论

美国华美银行个人开户攻略 2026在线视频见证免赴美中文服务

2026年4月29日星期三

小米大模型负责人实测OpenClaw：凌晨2点聊到天亮，1T参数成入场券

Tags: 大模型 Agent框架 OpenClaw 1T参数 AGI预测

凌晨2点装上它，然后一直聊到天亮

它和Claude Code的真正区别

她怎么在公司内部推OpenClaw

群体智慧能改进一个框架

1T参数，是下一阶段的入场券

Pre Train、Post Train和Research的算力比例

没有组别，没有等级，20-30人训出1T模型

研究做完了就不发论文了

她怎么看现在的竞争格局

AGI还有多远

写在最后

没有评论:

发表评论

美国华美银行个人开户攻略 2026在线视频见证免赴美中文服务

Tags:

大模型

Agent框架

OpenClaw

1T参数

AGI预测