2026年4月29日星期三

小米大模型负责人实测OpenClaw:凌晨2点聊到天亮,1T参数成入场券

小米大模型负责人罗福莉深度访谈:实测OpenClaw后从凌晨2点聊到天亮,认为其自主性与开源可改性远超预期。她提出1T参数量是Agent时代入场券,团队无组别、20-30人即可训练1T模型,预测两年内AGI将颠覆工作模式。适合AI开发者与技术管理者了解前沿判断。

Tags:

罗福莉不喜欢"AI天才少女"这个标签。
她是小米大模型的负责人,此前在DeepSeek参与过核心模型的研发。这次访谈发生在OpenClaw爆火之后,也在小米MiMo V2系列模型发布之后。
她聊了很多平时不会公开说的事:为什么一个Agent框架能让她从凌晨2点聊到天亮,为什么她认为1T参数量是接下来竞争的入场券,为什么她的团队没有组别、没有层级、连论文都很少发。
以下是这场对话里最值得认真读的部分。

凌晨2点装上它,然后一直聊到天亮

春节假期,罗福莉深夜在家装了OpenClaw。
折腾了大概两个小时,终于跑起来。然后她开始跟它聊天。
从凌晨2点,聊到早上6点。
"我脑子里不知道是多巴胺还是内啡肽,一直在分泌。兴奋到完全睡不着。"
她说第一感受,是它非常自主,而且"有灵魂"。聊到很晚,它会主动提醒:你现在很晚了,早点休息吧。这种温度感,是第一次用OpenClaw的人几乎都会感受到的东西。
但她没有停在这里。
第二天,她开始想:这东西不止于此。
于是她试着把真实的工作问题抛给它。第一个话题是——如何在团队里激发好奇心,怎么筛选一个真正有好奇心的人。
然后她跟它深聊了一个多小时。
"它在哲学层面上已经远超我的想象。"
第三天,她让它做研究任务。一个她认为很重要的课题:在Agent框架下,怎么构建一个好的User Agent?
聊了一两个小时,她说:这件事,基本上已经完成了。
"三天,每天都给我更多惊喜。"

它和Claude Code的真正区别

很多人最初的判断,和她一样:OpenClaw不过是Claude Code加了个即时通讯界面,换了个交互形式。
她后来改变了这个判断。
真正的区别,在套具(harness)的设计逻辑上。
Claude Code是为软件工程设计的。它的记忆系统、工作流设计、压缩逻辑,全部围绕"更好地写代码"展开。这让它在编程任务上极度稳定,但它的框架目标是单一的。
OpenClaw的设计逻辑不同。它在想的不是"怎么让模型写更好的代码",而是"怎么让模型端到端地完成任务,同时弥补模型本身的能力短板"。
举个例子:在Claude Code里,如果模型的视频理解能力不行,你得自己去配一个更好的视频理解模型。在OpenClaw里,你把视频扔给它,它会自己找一个视频理解能力更强的模型来处理这一块。
"这种自主性,弥补当代模型短板的能力,超出了我的预期。"
还有一点让她印象深刻:OpenClaw是开源的,可以直接改它的源代码。
她在用Claude Opus 4.6跑了一周高强度工作之后,开始亲手修改OpenClaw的整个Agent架构——设计新的记忆系统,重构Multi Agent的逻辑。
"Claude Code是黑盒,你改不了它的Agent工作流。OpenClaw给了你原生的可操作空间,这种冲击感是巨大的。"
这种开源可改的特性,也是它在中国爆火的重要原因之一。她的判断是:国内开发者对效率提升的需求更迫切,加上有大量便宜好用的国产模型可以接入,价格和价值的比值非常划算,让人愿意真的去用。

她怎么在公司内部推OpenClaw

罗福莉在春节假期高度兴奋,恨不得让所有人都去用。她在群里疯狂安利,但没什么人回应——大家在过年,在陪家人。
节后回来,她下了一个"命令":
如果明天你和OpenClaw的对话轮数没有超过100轮,你可以直接走人。
她说这是一种态度表达,而不是真的要考核——她根本没有验证方法,也没有打算验证。她只是想传递一种紧迫感:你可能真的要落后了。
第二天,有人来问她:你说的那个100轮,是认真的吗?
"我说,你就去用吧。我自有我的考核方法。"
事实上她的"考核方法",是直接感知——当一个人真的用起来,他自然会在群里分享,会有自己的发现,会有自己的惊叹。这比任何考核都诚实。
为了降低门槛,她买了几台Mac Mini,自己帮团队部署好,分配到不同的群组里,让大家可以直接进去用,不用自己折腾几个小时的安装过程。
效果是:节后两天,整个团队都在群里"骚动"——一刻不停地在群里分享各自的发现,看别人做了某件事,就想自己也去试,群消息随时999+。
"这是一次非常愉快的集体探索,不痛苦,不残酷,真的很好玩。"

群体智慧能改进一个框架

她做了一个实验:把OpenClaw接入一个100多人的飞书群,让大家同时和它互动。
理论上,这很混乱——100多人背景不同,大家都在疯狂改它的框架,模型本身没有变,Agent架构也没有定向训练。
结果:它变得越来越聪明。
"一群人改进,可能几小时就迭代一次。如果只是我自己改,进展会非常缓慢。"
这让她第一次真实感受到——群体智慧本身,可以成为改进一个系统的核心驱动力。
这个发现,后来延伸成她对整个AI发展路径的一个核心判断:AGI的到来,不会是某一个公司单独做到的事,而是所有人共同参与、共同贡献智识的结果。
她把这叫做"群体智能促成更强智能的生成"。

1T参数,是下一阶段的入场券

讲完OpenClaw,她讲了MiMo V2系列的判断逻辑。
核心论点很直接:如果你想在Agent时代有竞争力,你需要一个至少1T参数量的基座模型,而且它在Agent场景下的能力要接近Claude Opus 4.6的水平。这是入场券,不是加分项。
原因是什么?
因为Agent任务的本质,是长上下文、多轮交互、端到端地完成复杂任务。这类任务对模型的基础能力要求极高。没有足够大的基座,框架设计再精妙,也只能做到"看起来能用",而不是"真正稳定可靠"。
她说,有一些团队用10B(激活参数)的模型,在Agent框架下也做出了很好的效果。但这更多是框架的胜利,而不是模型能力本身的体现。真正意义上的竞争,还是要回到基座模型的量级上。
为了训练1T的模型,她做了一个关键的架构选择:混合注意力机制(Hybrid Attention)+ MTP(多token预测),而不是当时更主流的MLA(多头潜在注意力)。
这个选择背后的逻辑是:MLA在Chat时代是一个很优雅的结构,它在有限算力下显著降低了推理成本。但它有一个问题——它是为"训练结束后就固定用"这个假设设计的,对后训练阶段的迭代空间不够友好。
而Agent时代,后训练的地位越来越重要。她甚至判断,在顶级团队里,今年投入到后训练的算力比例,可能已经接近和预训练持平——而过去,这个比例大概是5:1甚至更高。
"你要是在预训练阶段就把结构定死,后训练的灵活性就受限了。"
混合注意力的结构留了更多余量,配合MTP可以在推理时充分利用剩余算力,实现更低成本、更快速度的推理。这也是为什么用户在用MiMo V2系列时,最常提到的感受是"快"。

Pre Train、Post Train和Research的算力比例

她给出了一个她认为合理的算力分配比例:
研究:预训练:后训练 ≈ 3:1:1
这个比例和过去差距很大。过去的Chat时代,预训练和后训练的比例可能是5:1甚至更悬殊——预训练占绝对主导。
现在,后训练的重要性大幅提升,几乎和预训练并驾齐驱。
而研究的算力,她认为应该至少等于正式训练的总卡数——因为你需要大量并行实验来找方向,而不是等一个结论出来再动手。
"有了Agent辅助,过去可能要三四十周的研究,现在三四周就能推进完。"

没有组别,没有等级,20-30人训出1T模型

她提到,MiMo的团队大概100人,但真正参与到第一代模型全链路训练的,只有20到30人。
而且这个团队没有组别划分,没有明确的层级,人员会根据训练阶段自然流动——做预训练的人会去做后训练,做Infra的人会和算法工程师一起调bug。
为什么不分组?
她说了一个理由:分组会杀死创造力。
如果你规定"这个人是做预训练的",他就会停止思考后训练的问题。而预训练的人去做后训练,天然有一个优势:他更懂数据的多样性,因为预训练本来就要处理各种各样的数据,而后训练如果只盯着某个场景,很容易做偏。
她也不关心候选人的历史背景是否足够漂亮——更在意的是,这个人的上限可能在哪里,以及他是否真的对这件事有热情。
"环境比经验更重要。一个人进来,放在一个高标准的环境里,一两个月就能把核心能力学会。"
招聘越来越倾向于本科生甚至在读生,原因是他们对新范式的接受度更高,想象力还没被规训,敢于把自己的想法直接扔进框架里去验证。

研究做完了就不发论文了

她有一个很直接的立场:自己做的实验,比论文更可信。
"我现在基本不读学术会议的论文了。我更相信自己跑出来的实验结果,而不是别人发表的实验结果。"
她偶尔会看一篇论文,但主要是看作者的原始动机和关注的问题是什么,而不是复现它的结论。
团队也很少发论文。她说,只要不发,越少越好。核心原因是:论文会暴露你在想什么。

她怎么看现在的竞争格局

关于国内外大模型的距离,她给出了一个判断:
"反应速度够快的话,追上当代Claude的概率相当高。差距大概在两三个月。"
但这个两三个月不是说"两三个月后就能追上",而是说:现在国内有几家已经有1T基座的团队,如果后训练和Agent范式的切换足够快,理论上可以在两三个月内做到和当代Claude Sonnet或Opus接近的水平。
她也承认,Anthropic在这条路上走得更早,至少提前了两年。但过去那两年大家没有意识到这是最正确的路——或者意识到了但做法不对。
现在路径已经更清晰了:做好Agent的强化学习scaling,让模型在复杂的长程任务里持续稳定。这是今年所有顶级团队共同在推进的方向。

AGI还有多远

她画了一条20%到100%的进度条。
她说,Flash模型发布时,大概在5%。现在,大概在20%。
今年能走到哪里?
"至少60%到70%。"
什么时候AGI?
"两年内。"
她对AGI的定义,不是某一个技术指标,而是:大多数人会真实感受到自己的工作方式被颠覆。先是工作方式改变,然后是生活方式改变,最后,才是真正意义上的范式切换完成。
她说了一句有点沉的话:
"如果AI能在两年内实现,那意味着很多人会在这段时间内真实地失去原来的工作模式。这件事会有很多痛苦。"
但她同时说,她并不担忧。
"90%的工作被替代之后,人们会想做什么?我觉得大家会想到很多有意思的事情。"
她自己想做的,是支持国内基础研究——建一个有计算资源、有资金支持的公益性组织,让那些在前沿方向上独立探索的研究者不用为钱和算力发愁。
"科学研究应该被加速,而不是被阻拦。"

写在最后

罗福莉的工作节奏是:早上11点开始,深夜结束。睡眠4到6小时,她觉得够了。
"对正在做的事情很兴奋,睡多了反而觉得浪费。"
有人问过她,做这件事的意义是什么。
她想了想,说:
"每天早上起来,我会问自己——今天做的这件事,是让世界变得更好了吗?还是让某些无聊的工作被替代了,让人有更多时间去做真正有价值的事?"
"只要答案是肯定的,就够了。"

· END ·
本文基于对小米大模型负责人罗福莉的深度访谈整理撰写。

收钱能力训练:突破不敢报价的心理关,从小钱练起

本文分析赚不到钱的深层原因是心理问题,指出大多数人只懂“赚”不会“收”。文章梳理了不敢收钱的三个心理关口(怕拒绝、觉得自己不配、混淆收钱与推销),并提供三个可操作经验:先从小额收费练手感、把报价当作客户筛选、收钱与交付同步进行。适合内容创作者、自由职业者、草根创业者突破变现障碍。

Tags:


很多人以为,赚不到钱是能力问题。

我观察了好几年,发现不是。

是心理问题。

而且这个问题,大部分人一辈子都没迈过去。


赚钱这件事,本质上不是一个动作,是两个动作。

一个是赚,一个是收。

大多数人只学会了赚,没学会收。


什么叫赚?

做流量、做内容、做产品、做服务,这些都是在创造价值。


什么叫收?

报价格、谈成交、收钱、交付,这是把价值换成钱。


你想想自己。

是不是一直在拼命学怎么赚,从来没有认真学过怎么收。

写了一百篇文章不敢放收款码。

加了几千个好友从来不敢聊成交。

别人主动来问价格,你心跳加速手心出汗。

这不是能力问题,这是你没练过。


收钱本身就是一种需要刻意练习的能力。

跟你学写作、学拍视频、学做图是一样的。

你不可能天生就会。

你不练,就永远卡在这儿。

那为什么大多数人不练呢。

大多数人卡在三个心理关口上。


第一关,怕被拒绝。

这个是最常见的。

报价之前脑子里已经演了一出戏。

他会不会觉得我太贵,他会不会觉得我不值,他会不会觉得我掉钱眼里了。

你琢磨的全是别人怎么看你。

但你想过没有,拒绝是正常的。


我做茶馆5年,定价99,到现在还有人跟我说太贵了。

一开始我也难受,后来我想通了。

他不是觉得我不值,他是现阶段不需要。

这跟你好不好没关系。

你卖的是价值,不是人情。

人家不需要,你就别硬给。

想通这一点,报价的时候手就不抖了。


第二关,觉得自己不配。

这个比怕被拒绝更深一层。

有些人产品也做好了,服务也到位了,但就是觉得自己不配收钱。

总觉得应该再积累积累,再打磨打磨,再免费服务几个客户攒攒经验。


我跟你说一个扎心的真相。

你不收钱,不是因为你不配。

是因为你把“不配”当成了一个借口,来逃避“收钱之后要负责”的压力。

免费的时候你都没有心理负担。

收钱了就得对结果负责,这个压力你不想面对。

但你不想面对,就永远长不大。


第三关,也是最隐蔽的一关。

很多人把收钱和卖货搞混了

觉得收钱就是推销,就是打扰别人,就是那些被屏蔽的朋友圈广告。

但你想想,你在线下买东西的时候是什么感觉。

你进一家店,看中一件衣服,问多少钱。

老板说了价格,你付钱拿走。


这个过程打扰你了吗,没有。

因为你本来就想要。

线上也是一样的。

你写文章、拍视频,把对你感兴趣的人吸引过来。

他们问你价格,你报了。


这不是推销,这是需求对接。

你不是在打扰谁,你是在帮需要你的人解决问题。

把这一点想通了,报价就变得理直气壮。


如果你现在正卡在不敢收钱这个阶段,我分享三个经验,你可以试试。

第一、先从小钱收起。

不用一上来就报几百几千。

你怕的不是收钱,你怕的是收大钱。

那先收小的。

9.9的资料包,三十块的咨询,五十块的社群,都可以。

目的不是赚那个钱,是让你收钱的手感练出来。

收过九块九,你就知道原来没什么大不了的。

下次就敢收99。

再下次就敢收999。


收钱是有肌肉记忆的,跟健身一模一样。

一开始你连空杠铃都推不动,练两个月就能加片了。

我当年也是从收9.9的电影资源开始的。

收第一单的时候犹豫了三天。

收到微信红包点开那一瞬间,手都有点抖。

但收了十个之后,我发现天没塌,朋友没少,信任没崩。

反而筛出了那些真正认可我的人。


第二、把报价当成筛选。

很多人不敢报价是怕把人吓跑。

但你想过没有,不认可你价值的人,本来就不是你的客户。

你报价9,他觉得贵,走了。

这对你是好事。

因为留下的人,才是愿意为价值付费的人。

你把精力花在这些人身上,交付好,口碑自然就出去了。


、收钱和交付同步做。

很多人有一个思维误区,觉得要等自己准备好了再收钱。

你先收了,被逼着交付,成长速度是最快的。

我每次开了新业务,都是先收钱,再倒逼自己把交付体系搭建起来。

压力就是动力。

真空环境里准备的再充分,也没有真刀真枪来得有效。


收钱这件事,是你赚钱之路的成人礼。

没过这一关之前,你永远觉得自己在准备。

过了这一关,你会发现,赚钱这件事,真正开始了。

不是贪财,不是割韭菜,是对自己的价值有了最起码的确认。


我做了8年内容,茶馆更新了1800多天,每天都在琢磨一件事。

怎么让更多有想法的人,迈过收钱这一步。

因为一旦迈过去,你看赚钱这件事,视角就完全不一样了。

不只是盯着流量和技巧,而是真正理解,交易的本质是把你的价值准确交到需要它的人手里。

这个能力,值得你花时间去练。


————

对了,如果你手里有跑通的项目,欢迎私我合作

你带一带群友,给群友带来有价值的实操。

我也能给你带一波流量。


赚钱的第一步是开眼,如果你想了解更多“赚钱信息差”,欢迎加入小茶馆社群(99/人):每天一篇赚钱干货,已持续更新1700天!

图片


王一书 | 专注草根创业实战

公众号【王叔笔记】主理人,8年互联网创业经验,原创文章被36氪、虎嗅等转载,全网阅读超千万。

扫码可领取我原创的电子书《网络草根创业指南》,从0到百,压箱底的经验,都在这里面了。

图片

 


小米大模型负责人实测OpenClaw:凌晨2点聊到天亮,1T参数成入场券

小米大模型负责人罗福莉深度访谈:实测OpenClaw后从凌晨2点聊到天亮,认为其自主性与开源可改性远超预期。她提出1T参数量是Agent时代入场券,团队无组别、20-30人即可训练1T模型,预测两年内AGI将颠覆工作模式。适合AI开发者与技术管理者了解前沿判断。 Tags: ...