OpenAI核心工程师翁家翌分享从清华到CMU、加入OpenAI的经历,亲述GPT-3.5到GPT-5的内部视角。涵盖人才密度、RLHF工程挑战、为何不读PhD、对AGI的谨慎判断,以及对年轻学生的职业建议:追求影响而非安全路径。适合AI从业者、学生及关注大模型发展的人。
Tags:
2022 年加入 OpenAI,参与了从 GPT-3.5 到 GPT-5 的每一次关键跃迁——这是翁家翌身上最显眼的标签。
但如果你只记住这个,可能会错过更重要的东西。
在这期播客里,翁家翌分享了他从清华到 CMU、从开源社区到 OpenAI 的完整路径,以及他在 AI 风暴中心亲历的观察和思考。有一些东西,可能会改变你对 AI 行业的认知。
1. 那个从小就会“投资未来”的小孩
翁家翌小时候并不是传统意义上的“乖孩子”。他会为了玩游戏和父母斗智斗勇,也会为了搞懂电脑背后的原理废寝忘食。
但有一点很特别:他在很小的时候就表现出对“未来”的关注。具体表现为,他会主动做一些在当时看来“没有即时回报”的事情,比如很早就开始学编程、初中就开始接触计算机竞赛的知识。
这种“投资未来”的意识贯穿了他的成长路径。高中搞计算机竞赛,本科进清华选择计算机系,每一个选择背后都有一个逻辑:这不是为了当下有什么回报,而是为了未来某个时刻能够派上用场。
这个逻辑在他后来做开源项目和选择加入 OpenAI 时都再次出现了。
2. 打破信息差:一个开源贡献者的初心
在清华本科期间,翁家翌做了一个在当时看来“不太主流”的事情:把作业和资料开源。
这个决定的出发点很简单:他发现很多人被信息差挡在外面。有人想买票但找不到方法,有人想学东西但找不到资料。与其让这些知识烂在自己手里,不如公开出来。
这个逻辑后来延伸到了他做的两个著名开源项目:
天授(Tianshou):一个强化学习框架。翁家翌做它的理由是市面上的 RL 框架要么太难入门,要么功能不够完整。他想做一个“让更多人能用到”的工具。
tuixue online:一个签证查询系统。这个看起来和 AI 无关的项目,实际上体现了他一貫的做事逻辑——看到一个问题,解决它,让它对更多人有用。
“我把做工具看作一种慈善。开源不是履历装饰,而是真的想产生影响。追求的不是掌声,而是 impact。”
这句话是他对“为什么要开源”最直接的回应。
3. 为什么没有读 PhD?
一个有意思的细节是,翁家翌在 CMU 读完硕士后就直接加入了 OpenAI,没有继续读 PhD。
他的解释很实际:
“我觉得研究能力和工程能力都很重要,但在 OpenAI 这样的地方,工程能力某种程度上更加关键。因为你需要把想法真正变成可以运行的东西。”
这不是说 PhD 不好,而是说他选择了另一条路——直接去解决最实际的问题,而不是在学术框架里绕一圈。
这个选择和他的价值观一致:追求 impact,而不是追求某种“正确”的路径。
4. 在 OpenAI 亲历的“风暴”
2022 年加入 OpenAI 的时候,翁家翌刚好赶上了 ChatGPT 诞生前的关键时期。以下是他分享的一些内部视角:
关于人才密度
OpenAI 最让他震撼的不是某个人有多厉害,而是整个组织的人才密度。“每个人都很强”不是夸张,而是真实感受。这种环境下,协作的效率比单打独斗高得多。
关于 RLHF(人类反馈强化学习)的挑战
在做 GPT-3.5 和 GPT-4 的后训练(post-training)时,最大的挑战不是算法本身,而是基础设施(infra)。模型变大之后,如何高效地收集反馈、如何快速地迭代训练,这些都是工程层面的难题。
“大模型工业级 RL infra 的挑战,可能是未来几年最被低估的问题之一。”
关于发布 ChatGPT 前的预期
在被问到“发布 ChatGPT 之前能想象到这种成功吗”时,翁家翌的回答很有意思:大模型团队内部其实一直对自己的技术有信心,但产品化和大规模部署是另一回事。ChatGPT 的成功不完全是技术的成功,也是产品化和工程化的成功。
5. 那些可能被问到的问题
现在的预训练和后训练可以达到 AGI 吗?
翁家翌的回答比较谨慎。他认为单纯依靠现在的预训练+后训练范式,要达到真正的 AGI 还有很长的路要走。但这不代表没有其他路径——也许新的范式还在探索中。
OpenAI 还 Open 吗?
这是一个被问烂了的问题。翁家翌的回答比较实在:OpenAI 的名字和使命没有变,但商业化的压力确实让一些东西变得复杂。这不是“变坏了”,而是“成长了”——一个组织从几十人走到几百人、几千人,很多事情自然会发生变化。
Sam Altman 被开除那件事
对于这个敏感话题,翁家翌没有过多评论,只是说这是“内部视角很复杂,但外部解读往往更复杂”的事情。
6. 未来与宿命论
在播客的后半段,翁家翌还聊到了一个比较哲学的话题:未来与宿命论。
他的观点是:我们总是试图预测未来、规划未来,但真实情况是——很多事情回头看才有意义,在当下其实很难判断。
“回头看,每一步都像命中注定;但站在当下,你会发现每一步都有很多可能性和偶然性。”
这和他自己的经历也很吻合:如果当初按部就班地走“正确”的路径,现在可能完全不一样。他没有刻意规划要进 OpenAI、要做 GPT,只是不断地在每个节点上做他认为“对的事情”,然后机会自然来找他了。
这个态度也影响了他的职业选择:不追求“安全”的路径,而是追求“有意义”的事情。
7. 他对年轻人的建议
还会鼓励今天的学生读 AI PhD 吗?
他的回答是:取决于你想要什么。如果你想做最前沿的研究,PhD 仍然是最好的路径;但如果你想更快地产生影响,去工业界也是完全可行的选择。关键是你得想清楚自己要什么,而不是随大流。
有什么想对十年前的自己说?
“不要把事情想得太复杂。很多当时觉得很重要的事情,回头看其实没那么重要。保持好奇心,保持简单,可能比什么都重要。”
关于翁家翌:2022 年加入 OpenAI,是 GPT-3.5、GPT-4、GPT-5 的核心贡献者。主要贡献领域:强化学习(RL)、后训练(post-training)、基础设施(infra)。在此之前,他是天授(Tianshou)强化学习框架和 tuixue online 签证查询系统的作者。清华本科,CMU 硕士。