2026年4月7日星期二

翁家翌亲述:OpenAI内部视角、GPT背后真相与AI工程师职业建议

OpenAI核心工程师翁家翌分享从清华到CMU、加入OpenAI的经历,亲述GPT-3.5到GPT-5的内部视角。涵盖人才密度、RLHF工程挑战、为何不读PhD、对AGI的谨慎判断,以及对年轻学生的职业建议:追求影响而非安全路径。适合AI从业者、学生及关注大模型发展的人。

Tags:

图片

2022 年加入 OpenAI,参与了从 GPT-3.5 到 GPT-5 的每一次关键跃迁——这是翁家翌身上最显眼的标签。

但如果你只记住这个,可能会错过更重要的东西。

在这期播客里,翁家翌分享了他从清华到 CMU、从开源社区到 OpenAI 的完整路径,以及他在 AI 风暴中心亲历的观察和思考。有一些东西,可能会改变你对 AI 行业的认知。

1. 那个从小就会“投资未来”的小孩

翁家翌小时候并不是传统意义上的“乖孩子”。他会为了玩游戏和父母斗智斗勇,也会为了搞懂电脑背后的原理废寝忘食。

但有一点很特别:他在很小的时候就表现出对“未来”的关注。具体表现为,他会主动做一些在当时看来“没有即时回报”的事情,比如很早就开始学编程、初中就开始接触计算机竞赛的知识。

这种“投资未来”的意识贯穿了他的成长路径。高中搞计算机竞赛,本科进清华选择计算机系,每一个选择背后都有一个逻辑:这不是为了当下有什么回报,而是为了未来某个时刻能够派上用场。

这个逻辑在他后来做开源项目和选择加入 OpenAI 时都再次出现了。

2. 打破信息差:一个开源贡献者的初心

在清华本科期间,翁家翌做了一个在当时看来“不太主流”的事情:把作业和资料开源。

这个决定的出发点很简单:他发现很多人被信息差挡在外面。有人想买票但找不到方法,有人想学东西但找不到资料。与其让这些知识烂在自己手里,不如公开出来。

这个逻辑后来延伸到了他做的两个著名开源项目:

天授(Tianshou):一个强化学习框架。翁家翌做它的理由是市面上的 RL 框架要么太难入门,要么功能不够完整。他想做一个“让更多人能用到”的工具。

tuixue online:一个签证查询系统。这个看起来和 AI 无关的项目,实际上体现了他一貫的做事逻辑——看到一个问题,解决它,让它对更多人有用。

“我把做工具看作一种慈善。开源不是履历装饰,而是真的想产生影响。追求的不是掌声,而是 impact。”

这句话是他对“为什么要开源”最直接的回应。

3. 为什么没有读 PhD?

一个有意思的细节是,翁家翌在 CMU 读完硕士后就直接加入了 OpenAI,没有继续读 PhD。

他的解释很实际:

“我觉得研究能力和工程能力都很重要,但在 OpenAI 这样的地方,工程能力某种程度上更加关键。因为你需要把想法真正变成可以运行的东西。”

这不是说 PhD 不好,而是说他选择了另一条路——直接去解决最实际的问题,而不是在学术框架里绕一圈。

这个选择和他的价值观一致:追求 impact,而不是追求某种“正确”的路径。

4. 在 OpenAI 亲历的“风暴”

2022 年加入 OpenAI 的时候,翁家翌刚好赶上了 ChatGPT 诞生前的关键时期。以下是他分享的一些内部视角:

关于人才密度

OpenAI 最让他震撼的不是某个人有多厉害,而是整个组织的人才密度。“每个人都很强”不是夸张,而是真实感受。这种环境下,协作的效率比单打独斗高得多。

关于 RLHF(人类反馈强化学习)的挑战

在做 GPT-3.5 和 GPT-4 的后训练(post-training)时,最大的挑战不是算法本身,而是基础设施(infra)。模型变大之后,如何高效地收集反馈、如何快速地迭代训练,这些都是工程层面的难题。

“大模型工业级 RL infra 的挑战,可能是未来几年最被低估的问题之一。”

关于发布 ChatGPT 前的预期

在被问到“发布 ChatGPT 之前能想象到这种成功吗”时,翁家翌的回答很有意思:大模型团队内部其实一直对自己的技术有信心,但产品化和大规模部署是另一回事。ChatGPT 的成功不完全是技术的成功,也是产品化和工程化的成功。

5. 那些可能被问到的问题

现在的预训练和后训练可以达到 AGI 吗?

翁家翌的回答比较谨慎。他认为单纯依靠现在的预训练+后训练范式,要达到真正的 AGI 还有很长的路要走。但这不代表没有其他路径——也许新的范式还在探索中。

OpenAI 还 Open 吗?

这是一个被问烂了的问题。翁家翌的回答比较实在:OpenAI 的名字和使命没有变,但商业化的压力确实让一些东西变得复杂。这不是“变坏了”,而是“成长了”——一个组织从几十人走到几百人、几千人,很多事情自然会发生变化。

Sam Altman 被开除那件事

对于这个敏感话题,翁家翌没有过多评论,只是说这是“内部视角很复杂,但外部解读往往更复杂”的事情。

6. 未来与宿命论

在播客的后半段,翁家翌还聊到了一个比较哲学的话题:未来与宿命论。

他的观点是:我们总是试图预测未来、规划未来,但真实情况是——很多事情回头看才有意义,在当下其实很难判断。

“回头看,每一步都像命中注定;但站在当下,你会发现每一步都有很多可能性和偶然性。”

这和他自己的经历也很吻合:如果当初按部就班地走“正确”的路径,现在可能完全不一样。他没有刻意规划要进 OpenAI、要做 GPT,只是不断地在每个节点上做他认为“对的事情”,然后机会自然来找他了。

这个态度也影响了他的职业选择:不追求“安全”的路径,而是追求“有意义”的事情。

7. 他对年轻人的建议

还会鼓励今天的学生读 AI PhD 吗?

他的回答是:取决于你想要什么。如果你想做最前沿的研究,PhD 仍然是最好的路径;但如果你想更快地产生影响,去工业界也是完全可行的选择。关键是你得想清楚自己要什么,而不是随大流。

有什么想对十年前的自己说?

“不要把事情想得太复杂。很多当时觉得很重要的事情,回头看其实没那么重要。保持好奇心,保持简单,可能比什么都重要。”


关于翁家翌:2022 年加入 OpenAI,是 GPT-3.5、GPT-4、GPT-5 的核心贡献者。主要贡献领域:强化学习(RL)、后训练(post-training)、基础设施(infra)。在此之前,他是天授(Tianshou)强化学习框架和 tuixue online 签证查询系统的作者。清华本科,CMU 硕士。


没有评论:

发表评论

2026年Depop开店避坑指南:新手跨境卖家必读

本文为计划在Depop开店的跨境卖家梳理关键避坑点:商品需聚焦复古/潮流风格,用真人展示图片;描述清楚尺码、材质、成色;注意欧美物流时效并提前说明;遵守平台假货侵权规则;收款支持Depop payments和PayPal,可通过WindPayer提现回国内。适合新手卖家入门参考。...