OpenAI CPO Kevin Weil:AI 每两个月就会突破一次,这是我职业生涯最疯狂的时刻

4 分钟阅读

背景与引子

2025年,AI 的发展速度已经超出了所有人的预期。就在我们录制这期节目的同一周,OpenAI 发布了一款新的图像生成模型,瞬间引爆了整个社交网络。人们用它重新想象自己的人生、家人、梦想——用 Kevin Weil 的话说,这可能是 ChatGPT 发布以来最病毒式传播的产品时刻。

但如果你仔细想想,这种”爆款”在 OpenAI 已经变得习以为常。从 GPT-3 的震撼,到 ChatGPT 的爆发,到 Sora 的惊艳,再到每一次模型更新带来的新可能——每隔几个月,整个行业就会被重新定义一次。

Kevin Weil,这位曾先后执掌 Instagram、Twitter 产品团队的资深人士,现在是 OpenAI 的首席产品官。他站在人类历史上可能是最重要公司的核心位置,每天都在思考一个核心问题:当技术每两个月就会发生质变时,你该如何做产品?

这期播客里,他分享了大量关于 OpenAI 内部运作的细节、对 AI 产品未来的洞察,以及他在 Meta 领导 Libra 项目失败的深层复盘。信息密度极高,值得反复咀嚼。


一、嘉宾是谁

Kevin Weil 是互联网产品领域最资深的从业者之一。在加入 OpenAI 之前,他担任 Instagram 产品负责人,更早之前是 Twitter 的产品负责人。在 Facebook 期间,他还深度参与了 Libra(后更名为 Novi)加密货币项目的创建,这个项目后来成为他职业生涯中最大的遗憾之一。

他同时担任 Planet、Strava、Black Product Managers Network 和 Nature Conservancy 的董事会成员。业余时间,他跑超马拉松,是那种真正把”长期主义”活成生活方式的人。

在 OpenAI,他负责从 ChatGPT 消费者产品到企业 API 的整体产品战略。但他说得最多的一个词,不是”战略”,而是”速度”。


二、核心观点 TOP10

  1. 你今天使用的 AI 模型,将是你这辈子用过的最差的一版。 接受这个事实,是理解 AI 世界的第一步。每两个月,模型就能做到它之前完全做不到的事情。

  2. 写作 evals(评估测试)将成为产品经理的核心技能。 在 AI 时代,你需要知道模型在不同场景下的准确率——是 60%、95% 还是 99.5%?这直接决定了你要构建什么样的产品。

  3. Chat 可能是人类与超级智能交互的最佳界面。 人类通过对话来思考和表达,而 AI 恰好最擅长理解人类语言的复杂性和微妙性。这是一种完美的匹配。

  4. 不要在模型能力边缘徘徊,给它两个月。 如果你的产品”勉强能用”,那说明你正在正确的方向上。两三个月后,模型会变得更强大,你的产品会突然”起飞”。

  5. OpenAI 不会做所有事情。 世界上有太多聪明人在公司外部。行业特定的垂直数据、公司内部的知识,都在模型训练集之外。这正是创业者的机会。

  6. 模型集成(ensemble)才是未来。 不同任务需要不同模型:有些需要快速廉价的 mini 模型,有些需要深度推理的 o 系列模型。把问题拆解,用专门的模型解决专门的问题,就像一个组织不同的人做不同的事。

  7. Vibe Coding 正在改变产品构建方式。 给 AI 一个 prompt,它写代码,遇到错误粘贴进去,让它继续跑。30 分钟内,一个原型就诞生了。这不是未来,这就是现在。

  8. 产品经理要”少而精”。 太多 PM 会让组织充满文档和想法,而少了执行。OpenAI 倾向于每个 PM 搭配”稍微多一点”的工程师,让工程师有更多的自主权和影响力。

  9. 与 AI 合作时,想象一个人类会怎么做。 当你不确定 UI 如何设计、流程如何优化时,问自己:一个优秀的人类同事会怎么处理这个情况?这个思路往往非常有效。

  10. 好的工作,长期坚持做。 卓越不是靠某个银子弹,而是每天一点点进步持续叠加。Kevin Weil 把这句话做成海报挂在房间里。


三、关键洞察

1. AI 行业的竞争本质,是一场”谁先证明可能性”的竞赛。

Kevin 用了一个田径史上的比喻:在 Roger Bannister 打破四分钟 mile 纪录之前,没人认为这是可能的。但一旦有人做到,第二年就有 12 个人做到了。Anthropic 的 Claude 在编程能力上实现了突破,Kevin 的态度是:完全认可他们的成就,同时也明确表示 OpenAI 也能做到——因为在 AI 领域,当有人证明了某个方向是可行的,追赶往往比开拓更容易。

2. 你不需要成为”提示词工程师”。

Kevin 认为,“需要学习复杂的提示技巧”是模型还不够好的表现。如果模型足够强大,使用它应该像和水瓶座同事沟通一样自然。他相信这个目标正在逐步实现,虽然目前还有一些”尖锐的边缘”需要专家去处理。

3. 创意工作的未来不是 AI 替代人类,而是 AI 扩展人类。

他分享了一个电影导演的例子:以前要花 10 万美元、等待一个月,让 3D 特效公司给你做两个版本的转场。现在用 Sora,输入 prompt,瞬间得到 50 个版本,让后迭代选择。导演不是被替代了,而是获得了前所未有的探索空间。


四、精彩金句

“你今天使用的 AI 模型,将是你这辈子用过的最差的一版。”

当你真正接受这一点,一切都会变得不同。Kevin 说,他在每次发布产品时都会想:6 个月后回看,这个版本会不会显得”很差”?答案几乎总是”会的”。这不是悲观,而是对技术演进规律的清醒认知。

“有时不是某一件事,而是长期持续做好工作的积累。”

这是 Mark Zuckerberg 在一次财报电话会议上说的话。Kevin 把这句话做成了海报挂在自己房间。他跑步跑超级马拉松,相信人生和做产品一样,都是靠每天一点点的积累。

“我们没有命名天赋,我们知道这很糟糕。”

Kevin 自嘲 OpenAI 的命名体系——03 mini、o3、o3 high——让他在每次访谈中都被追问这个问题。但紧接着他说:ChatGPT 是人类历史上增长最快的产品。所以,品牌命名可能真的没那么重要。

“你的产品’勉强能用’,说明你在做正确的事。”

这是他给所有 AI 创业者的建议:如果你正在模型的能力边缘构建产品,你正在正确的方向上。模型的进步会让你”刚好能用”的产品,在几个月后变成”极其出色”的产品。


五、实战案例

Deep Research:从”需要一周”到”需要30分钟”

OpenAI 的 Deep Research 产品,是 Kevin 最喜欢的发布之一。它的核心能力是:你可以给 ChatGPT 一个极其复杂的研究问题——如果你自己回答,可能需要花一周时间阅读论文、做搜索、写报告。Deep Research 可以”连续工作”25-30 分钟,然后给你一个可能需要一周才能完成的答案。

在开发这个产品时,团队做的事情是:定义”英雄用例”(hero use cases),把这些问题转化为 evals,然后围绕这些 evals 持续优化模型性能。他们不是等模型”准备好了”再做产品,而是和产品同步迭代 evals,让模型学会解决这些具体问题。

客服自动化:30-40人服务4亿周活用户

OpenAI 的用户规模是每周超过4亿活跃用户。按照传统逻辑,这需要庞大的客服团队。但实际上,他们只有三四十人负责客服工作——因为他们构建了一套基于 AI 的自动化流程:先用 AI 读取知识库,尝试回答用户问题;对于 AI 没有把握的,会有人工介入审查;而人工审查的结果,又成为新的训练数据,反馈给模型。

这正是一个”模型集成”的典型案例:不同问题用不同模型处理,有些需要快速廉价,有些需要深度推理,然后整合成最终输出。

Julia Vibe Coding 了整个内部工具

OpenAI 的首席人事官 Julia,用 Windsurf(一个 AI 编程工具)自己 vibe code 了一个她之前一直想要的内部工具。Kevin 在访谈中感慨:如果连我们的首席人事官都在这样做,我们没有任何借口不去更多地使用这些工具。


六、行动建议

1. 学会写 Evals——这是 AI 时代产品经理的核心能力

为什么要做:模型在不同场景下的准确率差异巨大,直接决定你能构建什么样的产品。60% 的准确率需要完全不同的工作方式,而 95% 的准确率则意味着你可以考虑完全不同的产品形态。

如何开始:选择你正在解决的核心问题,收集 50-100 个”好问题 + 好答案”的例子,测试模型在这些问题上的表现。你可以用模型来帮你生成这些测试用例,然后手动校验。

得到什么结果:一个可量化的基准线,让你知道在这个场景下,模型是否已经准备好支撑你的产品;如果没有准备好,差距在哪里,你需要什么样的 fine-tuning。

2. 用”人类类比法”设计 AI 产品

为什么要做:LLM 本质上是模仿人类理解和生成的模式。当你不确定某个设计时,想象一个优秀的人类会怎么做,往往能得到正确答案。

如何开始:在设计任何一个 AI 功能时,问自己:如果一个非常聪明、有经验的人类要完成这个任务,他们会有什么反应、会如何思考、会在哪里卡住?

得到什么结果:一个直观的设计方向,让你的产品体验更自然、更符合用户预期。Kevin 提到的一个具体例子:推理模型需要”思考”20 秒时,一个真正的人类不会沉默 20 秒然后突然给出答案——他们可能会说”让我想想”,然后给出一些提示。所以 ChatGPT 在这种场景下的 UI 设计就是:显示几个句子的思路摘要,而不是完整的思维链。

3. 采用 Model Maximalism——为”即将到来”设计产品

为什么要做:模型每两个月就会有一次质的飞跃。今天”勉强能用”的产品,几个月后可能就会变得”极其强大”。

如何开始:不要等到模型完全准备好了才去构建。相反,要构建那些”刚好在能力边缘”的产品,让模型成为你的核心驱动力。几个月后,当模型升级时,你的产品会瞬间变得更好。

得到什么结果:你将始终站在能力前沿,而不是在别人已经验证的领域里内卷。如果你的产品在今天”勉强能用”,这恰恰说明你正在正确的方向上。

4. 掌握 Vibe Coding——这是产品经理的新超能力

为什么要做:AI 编程工具已经足够强大,你可以在 30 分钟内从一个 idea 变成一个可以演示的原型。这不是替代工程师,而是让产品经理能够更快速地验证想法、和团队沟通概念。

如何开始:使用 Cursor、Windsurf 或 GitHub Copilot,给它一个 prompt,让它写代码,遇到编译错误就粘贴回去让它修复,不断迭代。不要追求”完美的生产代码”,追求”能证明概念的 demo”。

得到什么结果:你能快速验证想法,不需要等待工程师排期;你能在设计评审时展示真实的交互原型,而不是 Figma 上的静态图;你能在思考产品方向时有更直接的反馈循环。

5. 在 prompt 中使用 few-shot examples——这是你今天就能用的技巧

为什么要做:Kevin 说,很多人不知道给模型”举例子”有多有效。模型从例子中学习的效率,远高于从抽象指令中学习。

如何开始:在 prompt 中加入 2-3 个”问题 + 正确答案”的具体例子。让模型先看几个样本,再让它解决你要它解决的问题。

得到什么结果:即使不做完整的 fine-tuning,你的模型在特定任务上的表现也会显著提升。这是一种”轻量级的定制”,不需要额外训练,但效果惊人。


七、我的总结

Kevin Weil 分享了一个核心框架:AI 的本质,是每两个月就会发生一次能力跃迁的技术。这意味着所有的”当前局限”都是暂时的。

OpenAI 的成功不是因为他们提前预知了未来,而是因为他们接受了一个事实:他们无法预测未来。因此,他们的策略是: bottoms-up 授权团队、快速迭代、公开测试、持续优化。用 plan 本身而非 plan 的内容来指导行动。

对于所有在 AI 时代工作的人——无论你是创业者、产品经理、工程师还是普通用户——Kevin 的话值得反复思考:你今天使用的 AI 模型,将是你这辈子用过的最差的一版。

接受这个事实,你会获得一种奇特的平静:不必焦虑于”AI 是否会替代我”,而是专注于”我如何利用每次 AI 的突破,去做之前不可能做到的事情”。

至于 Kevin 本人从 Libra 项目中学到的教训——有些产品理念太超前了,你需要分步骤引入变化,而不是一次性颠覆整个系统。但核心问题永远值得坚持:让全世界的人能够像发短信一样便宜地转账,这个世界需要它,它应该存在。

也许有一天,它会以另一种形式出现。


📺 播客信息

  • 发布时间:2025-04-10
  • 时长:1小时31分钟41秒
  • 播放量:206125 次观看
  • 原版视频:『YouTube