OpenAI CPO Kevin Weil：AI 每两个月就会突破一次，这是我职业生涯最疯狂的时刻

背景与引子

2025年，AI 的发展速度已经超出了所有人的预期。就在我们录制这期节目的同一周，OpenAI 发布了一款新的图像生成模型，瞬间引爆了整个社交网络。人们用它重新想象自己的人生、家人、梦想——用 Kevin Weil 的话说，这可能是 ChatGPT 发布以来最病毒式传播的产品时刻。

但如果你仔细想想，这种”爆款”在 OpenAI 已经变得习以为常。从 GPT-3 的震撼，到 ChatGPT 的爆发，到 Sora 的惊艳，再到每一次模型更新带来的新可能——每隔几个月，整个行业就会被重新定义一次。

Kevin Weil，这位曾先后执掌 Instagram、Twitter 产品团队的资深人士，现在是 OpenAI 的首席产品官。他站在人类历史上可能是最重要公司的核心位置，每天都在思考一个核心问题：当技术每两个月就会发生质变时，你该如何做产品？

这期播客里，他分享了大量关于 OpenAI 内部运作的细节、对 AI 产品未来的洞察，以及他在 Meta 领导 Libra 项目失败的深层复盘。信息密度极高，值得反复咀嚼。

一、嘉宾是谁

Kevin Weil 是互联网产品领域最资深的从业者之一。在加入 OpenAI 之前，他担任 Instagram 产品负责人，更早之前是 Twitter 的产品负责人。在 Facebook 期间，他还深度参与了 Libra（后更名为 Novi）加密货币项目的创建，这个项目后来成为他职业生涯中最大的遗憾之一。

他同时担任 Planet、Strava、Black Product Managers Network 和 Nature Conservancy 的董事会成员。业余时间，他跑超马拉松，是那种真正把”长期主义”活成生活方式的人。

在 OpenAI，他负责从 ChatGPT 消费者产品到企业 API 的整体产品战略。但他说得最多的一个词，不是”战略”，而是”速度”。

二、核心观点 TOP10

你今天使用的 AI 模型，将是你这辈子用过的最差的一版。 接受这个事实，是理解 AI 世界的第一步。每两个月，模型就能做到它之前完全做不到的事情。
写作 evals（评估测试）将成为产品经理的核心技能。 在 AI 时代，你需要知道模型在不同场景下的准确率——是 60%、95% 还是 99.5%？这直接决定了你要构建什么样的产品。
Chat 可能是人类与超级智能交互的最佳界面。 人类通过对话来思考和表达，而 AI 恰好最擅长理解人类语言的复杂性和微妙性。这是一种完美的匹配。
不要在模型能力边缘徘徊，给它两个月。 如果你的产品”勉强能用”，那说明你正在正确的方向上。两三个月后，模型会变得更强大，你的产品会突然”起飞”。
OpenAI 不会做所有事情。 世界上有太多聪明人在公司外部。行业特定的垂直数据、公司内部的知识，都在模型训练集之外。这正是创业者的机会。
模型集成（ensemble）才是未来。 不同任务需要不同模型：有些需要快速廉价的 mini 模型，有些需要深度推理的 o 系列模型。把问题拆解，用专门的模型解决专门的问题，就像一个组织不同的人做不同的事。
Vibe Coding 正在改变产品构建方式。 给 AI 一个 prompt，它写代码，遇到错误粘贴进去，让它继续跑。30 分钟内，一个原型就诞生了。这不是未来，这就是现在。
产品经理要”少而精”。 太多 PM 会让组织充满文档和想法，而少了执行。OpenAI 倾向于每个 PM 搭配”稍微多一点”的工程师，让工程师有更多的自主权和影响力。
与 AI 合作时，想象一个人类会怎么做。 当你不确定 UI 如何设计、流程如何优化时，问自己：一个优秀的人类同事会怎么处理这个情况？这个思路往往非常有效。
好的工作，长期坚持做。 卓越不是靠某个银子弹，而是每天一点点进步持续叠加。Kevin Weil 把这句话做成海报挂在房间里。

三、关键洞察

1. AI 行业的竞争本质，是一场”谁先证明可能性”的竞赛。

Kevin 用了一个田径史上的比喻：在 Roger Bannister 打破四分钟 mile 纪录之前，没人认为这是可能的。但一旦有人做到，第二年就有 12 个人做到了。Anthropic 的 Claude 在编程能力上实现了突破，Kevin 的态度是：完全认可他们的成就，同时也明确表示 OpenAI 也能做到——因为在 AI 领域，当有人证明了某个方向是可行的，追赶往往比开拓更容易。

2. 你不需要成为”提示词工程师”。

Kevin 认为，“需要学习复杂的提示技巧”是模型还不够好的表现。如果模型足够强大，使用它应该像和水瓶座同事沟通一样自然。他相信这个目标正在逐步实现，虽然目前还有一些”尖锐的边缘”需要专家去处理。

3. 创意工作的未来不是 AI 替代人类，而是 AI 扩展人类。

他分享了一个电影导演的例子：以前要花 10 万美元、等待一个月，让 3D 特效公司给你做两个版本的转场。现在用 Sora，输入 prompt，瞬间得到 50 个版本，让后迭代选择。导演不是被替代了，而是获得了前所未有的探索空间。

四、精彩金句

“你今天使用的 AI 模型，将是你这辈子用过的最差的一版。”

当你真正接受这一点，一切都会变得不同。Kevin 说，他在每次发布产品时都会想：6 个月后回看，这个版本会不会显得”很差”？答案几乎总是”会的”。这不是悲观，而是对技术演进规律的清醒认知。

“有时不是某一件事，而是长期持续做好工作的积累。”

这是 Mark Zuckerberg 在一次财报电话会议上说的话。Kevin 把这句话做成了海报挂在自己房间。他跑步跑超级马拉松，相信人生和做产品一样，都是靠每天一点点的积累。

“我们没有命名天赋，我们知道这很糟糕。”

Kevin 自嘲 OpenAI 的命名体系——03 mini、o3、o3 high——让他在每次访谈中都被追问这个问题。但紧接着他说：ChatGPT 是人类历史上增长最快的产品。所以，品牌命名可能真的没那么重要。

“你的产品’勉强能用’，说明你在做正确的事。”

这是他给所有 AI 创业者的建议：如果你正在模型的能力边缘构建产品，你正在正确的方向上。模型的进步会让你”刚好能用”的产品，在几个月后变成”极其出色”的产品。

五、实战案例

Deep Research：从”需要一周”到”需要30分钟”

OpenAI 的 Deep Research 产品，是 Kevin 最喜欢的发布之一。它的核心能力是：你可以给 ChatGPT 一个极其复杂的研究问题——如果你自己回答，可能需要花一周时间阅读论文、做搜索、写报告。Deep Research 可以”连续工作”25-30 分钟，然后给你一个可能需要一周才能完成的答案。

在开发这个产品时，团队做的事情是：定义”英雄用例”（hero use cases），把这些问题转化为 evals，然后围绕这些 evals 持续优化模型性能。他们不是等模型”准备好了”再做产品，而是和产品同步迭代 evals，让模型学会解决这些具体问题。

客服自动化：30-40人服务4亿周活用户

OpenAI 的用户规模是每周超过4亿活跃用户。按照传统逻辑，这需要庞大的客服团队。但实际上，他们只有三四十人负责客服工作——因为他们构建了一套基于 AI 的自动化流程：先用 AI 读取知识库，尝试回答用户问题；对于 AI 没有把握的，会有人工介入审查；而人工审查的结果，又成为新的训练数据，反馈给模型。

这正是一个”模型集成”的典型案例：不同问题用不同模型处理，有些需要快速廉价，有些需要深度推理，然后整合成最终输出。

Julia Vibe Coding 了整个内部工具

OpenAI 的首席人事官 Julia，用 Windsurf（一个 AI 编程工具）自己 vibe code 了一个她之前一直想要的内部工具。Kevin 在访谈中感慨：如果连我们的首席人事官都在这样做，我们没有任何借口不去更多地使用这些工具。

六、行动建议

1. 学会写 Evals——这是 AI 时代产品经理的核心能力

为什么要做：模型在不同场景下的准确率差异巨大，直接决定你能构建什么样的产品。60% 的准确率需要完全不同的工作方式，而 95% 的准确率则意味着你可以考虑完全不同的产品形态。

如何开始：选择你正在解决的核心问题，收集 50-100 个”好问题 + 好答案”的例子，测试模型在这些问题上的表现。你可以用模型来帮你生成这些测试用例，然后手动校验。

得到什么结果：一个可量化的基准线，让你知道在这个场景下，模型是否已经准备好支撑你的产品；如果没有准备好，差距在哪里，你需要什么样的 fine-tuning。

2. 用”人类类比法”设计 AI 产品

为什么要做：LLM 本质上是模仿人类理解和生成的模式。当你不确定某个设计时，想象一个优秀的人类会怎么做，往往能得到正确答案。

如何开始：在设计任何一个 AI 功能时，问自己：如果一个非常聪明、有经验的人类要完成这个任务，他们会有什么反应、会如何思考、会在哪里卡住？

得到什么结果：一个直观的设计方向，让你的产品体验更自然、更符合用户预期。Kevin 提到的一个具体例子：推理模型需要”思考”20 秒时，一个真正的人类不会沉默 20 秒然后突然给出答案——他们可能会说”让我想想”，然后给出一些提示。所以 ChatGPT 在这种场景下的 UI 设计就是：显示几个句子的思路摘要，而不是完整的思维链。

3. 采用 Model Maximalism——为”即将到来”设计产品

为什么要做：模型每两个月就会有一次质的飞跃。今天”勉强能用”的产品，几个月后可能就会变得”极其强大”。

如何开始：不要等到模型完全准备好了才去构建。相反，要构建那些”刚好在能力边缘”的产品，让模型成为你的核心驱动力。几个月后，当模型升级时，你的产品会瞬间变得更好。

得到什么结果：你将始终站在能力前沿，而不是在别人已经验证的领域里内卷。如果你的产品在今天”勉强能用”，这恰恰说明你正在正确的方向上。

4. 掌握 Vibe Coding——这是产品经理的新超能力

为什么要做：AI 编程工具已经足够强大，你可以在 30 分钟内从一个 idea 变成一个可以演示的原型。这不是替代工程师，而是让产品经理能够更快速地验证想法、和团队沟通概念。

如何开始：使用 Cursor、Windsurf 或 GitHub Copilot，给它一个 prompt，让它写代码，遇到编译错误就粘贴回去让它修复，不断迭代。不要追求”完美的生产代码”，追求”能证明概念的 demo”。

得到什么结果：你能快速验证想法，不需要等待工程师排期；你能在设计评审时展示真实的交互原型，而不是 Figma 上的静态图；你能在思考产品方向时有更直接的反馈循环。

5. 在 prompt 中使用 few-shot examples——这是你今天就能用的技巧

为什么要做：Kevin 说，很多人不知道给模型”举例子”有多有效。模型从例子中学习的效率，远高于从抽象指令中学习。

如何开始：在 prompt 中加入 2-3 个”问题 + 正确答案”的具体例子。让模型先看几个样本，再让它解决你要它解决的问题。

得到什么结果：即使不做完整的 fine-tuning，你的模型在特定任务上的表现也会显著提升。这是一种”轻量级的定制”，不需要额外训练，但效果惊人。

七、我的总结

Kevin Weil 分享了一个核心框架：AI 的本质，是每两个月就会发生一次能力跃迁的技术。这意味着所有的”当前局限”都是暂时的。

OpenAI 的成功不是因为他们提前预知了未来，而是因为他们接受了一个事实：他们无法预测未来。因此，他们的策略是： bottoms-up 授权团队、快速迭代、公开测试、持续优化。用 plan 本身而非 plan 的内容来指导行动。

对于所有在 AI 时代工作的人——无论你是创业者、产品经理、工程师还是普通用户——Kevin 的话值得反复思考：你今天使用的 AI 模型，将是你这辈子用过的最差的一版。

接受这个事实，你会获得一种奇特的平静：不必焦虑于”AI 是否会替代我”，而是专注于”我如何利用每次 AI 的突破，去做之前不可能做到的事情”。

至于 Kevin 本人从 Libra 项目中学到的教训——有些产品理念太超前了，你需要分步骤引入变化，而不是一次性颠覆整个系统。但核心问题永远值得坚持：让全世界的人能够像发短信一样便宜地转账，这个世界需要它，它应该存在。

也许有一天，它会以另一种形式出现。

📺 播客信息

发布时间：2025-04-10
时长：1小时31分钟41秒
播放量：206125 次观看
原版视频：『YouTube』