如何在2025年衡量AI时代的开发者生产力
如何在2025年衡量AI时代的开发者生产力
嘉宾:Nicole Forsgren | 谷歌开发者体验高级总监 | 领域:开发者体验与工程效能
背景与引子
三年前,当Nicole Forsgren第一次做客这档播客时,我们关于AI与生产力的讨论只占了一个小时的尾声部分。彼时,AI还只是技术圈的热议话题,而非改变工作方式的核心力量。如今,一切都已不同。
从GitHub Copilot到Cursor,从Claude Code到各类AI编码助手,全球最快的增长公司几乎清一色是工程AI工具。数十亿美元涌入这个赛道,每家公司都在问同一个问题:这些AI工具真的让我们的开发者更高效了吗?效率提升了多少?
然而,当我们试图量化这些收益时,却发现答案远比想象中复杂。Nicole Forsgren是这个领域最有发言权的人——她创造了DORA和SPACE两大框架,撰写了被誉为“开发者效能圣经”的《Accelerate》,而她即将出版的新书《Frictionless》更是直指AI时代的开发者体验核心。
这场对话揭示了一个反直觉的真相:AI确实在加速编码,但开发者并没有像预期那样大幅提速。因为他们仍然要应对构建失败、不稳定的工具流程,以及大量新涌现的瓶颈。更关键的是,如何衡量这一切,至今仍是行业难题。
如果你正在带领工程团队、正在评估AI工具的投资回报,或者只是想知道如何让团队跑得更快,这篇文章值得你认真读下去。
一、嘉宾是谁
Nicole Forsgren在开发者体验领域的地位,无人能及。
她是DORA(DevOps研究评估)框架的创始人,这个框架在过去十年里成为全球科技公司衡量工程效能的标准方法。她还创建了SPACE框架,一个更全面的开发者体验评估体系。2018年,她与团队合著的《Accelerate》被《哈佛商业评论》评为年度最佳商业书籍之一,揭示了高效能工程团队的秘密。
在加入谷歌担任开发者体验高级总监之前,她曾帮助数百家公司优化工程效能。2024年,Atlassian以10亿美元收购了她曾担任早期顾问的开发者体验公司DX,这笔交易本身就是对开发者体验价值的最好证明。
她的新书《Frictionless》即将出版,这本与DX创始人Abby Notaro合著的著作,将为AI时代的开发者体验提供一套可操作的七步框架。
三年前她说“学习信任AI生成的代码将是最大挑战”,这个预言正在一一应验。
二、核心观点TOP10
-
大多数生产力指标都是谎言——如果目标是更多代码行数,AI可以轻松生成有史以来最冗长的代码。指标太容易被攻破。
-
代码行数不再是好的指标——LLM天然倾向于生成冗长代码。加上AI生成的代码后,我们需要区分哪些来自人、哪些来自机器,以及这些代码的长期存活率。
-
信任是AI时代的新维度——LLM是非确定性的,我们必须评估输出的可靠性、是否存在幻觉、是否符合代码风格。这不是可选项,而是必备能力。
-
代码审查的时间将超过代码编写的时间——这是三年前的预言,现在正在成为现实。我们需要重新思考工作日的结构。
-
流程优化往往比工具升级更有效——很多公司花大价钱买工具,却忽视了流程中的浪费。一次简单的流程改造,胜过多次技术重构。
-
大多数团队都可以更快——但问题是:更快是为了什么?我们可以每天更快速地交付垃圾。需要战略和明智决策来知道该交付什么。
-
倾听是改变的起点——与其购买工具,不如先去和开发者交谈。问他们昨天做了什么,哪些环节令人愉悦,哪些让人沮丧。
-
工程团队正在变成“AI工程团队的管理者”——即使只有45分钟的工作间隙,你也可以通过协调多个AI代理完成任务。AI可以帮助我们恢复上下文、快速进入状态。
-
AI代码助手真正的价值是“解锁”——研究者发现,AI生成了大量代码,但使用AI工具的工程师自己写的代码增量是AI生成量的两倍。AI更像是一个解除阻塞的催化剂。
-
开发者体验是一个产品——用产品思维来设计DX:找到要解决的问题、创建MVP和实验、持续获取反馈、适时淘汰不再重要的指标。
三、关键洞察
洞察一:AI让工程师变成了“包工头”
以前工程师需要自己一笔一划写代码,现在他们的角色正在转变为协调多个AI代理并行工作。优秀工程师的做法是:先花更多时间做前期规划,定义清楚要构建什么、架构如何、需要遵循什么规范,然后让不同的代理去并行处理各个模块。这要求更高层次的思考能力,但确实能实现更好的产出。
洞察二:45分钟工作块可能变得有价值
以往,进入心流状态需要至少两小时的专注时间。但在AI时代,机器可以帮助我们快速恢复上下文、生成系统图表、记住我们离开时的工作状态。这意味着以前“只能清理收件箱”的碎片时间,现在也可能变得有生产力。
洞察三:代码行数从糟糕指标变成了“有用但不充分”的指标
以前用代码行数衡量生产力已经很糟糕,现在有了AI,它变得更糟——因为AI生成的代码行数可以轻易爆炸式增长。但如果我们能区分哪些代码来自人、哪些来自机器,就可以回答一些有意义的后续问题:代码存活率如何?质量如何?是否在训练数据中引入了偏差?
洞察四:幸福感调查没有意义,满意度调查才有价值
幸福包含太多因素——工作、家庭、爱好、周末,不一而足。但我们可以问:你对这个工具满意吗?这两者相关但不同。更聚焦的满意度问题才能给出可操作的信号。
洞察五:DORA指标需要更新,但框架本身依然有效
DORA的四个核心指标——部署频率、变更前置时间、平均恢复时间、变更失败率——用于评估流水线的速度和稳定性依然有效。但我们不能盲目套用,因为AI已经改变了反馈循环的性质。我们需要在流水线中途就获得反馈,而不仅仅是等待最终编译结果。
四、精彩金句
“大多数生产力指标都是谎言。如果目标是更多代码行数,我可以提示AI生成有史以来最冗长的代码。这太容易作弊了。”
这句话直指指标设计的核心问题:我们测量什么,就会得到什么。当指标本身可以被轻松操纵时,它就不再反映真实情况。
“我们不能输入一个命令、得到返回结果然后直接接受。我们真的需要评估它——我们看到幻觉了吗?可靠性如何?它符合我们一贯的代码风格吗?”
信任是AI时代开发者的新必备能力。每一个AI输出都需要经过验证,而不是假设它是对的。
“我们可以每天更快速地交付垃圾。我们需要战略和真正明智的决策来知道该交付什么。”
速度本身不是目的。AI可以让我们跑得更快,但如果没有正确的方向,更快只会让我们更快地做错事。
“最好的建议就是去和人交谈、去倾听。很多时候,公司会说’我要构建这个工具’或者’我要实现那个自动化’。但如果你只是去和开发者聊聊天,问他们昨天做了什么、哪些环节很愉快、哪些很困难,你往往能发现一些相对低投入、高影响的改进点。”
大道至简。答案往往就在团队成员的口中,只是我们很少真正去问。
五、实战案例
案例一:省去三段楼梯的流程改造
Nicole分享了一个让她印象深刻的例子。某家公司有一个老旧的流程,需要工程师把文件打印出来、走下三四层楼梯获得审批、然后再走回去。整个团队都讨厌这个流程,但因为要重构整个系统太麻烦,所以一直搁置。
结果呢?他们什么都没重构,只是让这个流程改成发送一封邮件。就这样,问题解决了。没有技术债务,没有新系统,只是改变了一个早已过时的流程。
这个故事告诉我们:很多效率问题根本不需要技术方案,需要的只是有人愿意去听、去看、然后动手改变。
案例二:顶级工程师的AI工作流
Nicole观察过一些真正掌握AI工具的工程师,他们的工作方式令人印象深刻。诀窍在于前期投入更多时间:先让AI帮助设计整个架构——需要什么技术栈、遵循什么工作流、各模块如何协同。然后为每个模块分配一个代理并行工作,并明确要求它们确保各部分能协同运行、遵循正确的API和约定。
这样运行几分钟后,工程师可以切换去做其他事情,回来时得到的产出已经接近生产级代码——远优于随意的“氛围编码”。
案例三:从想法到用户的时间压缩
以前,一个功能从想法到生产环境可能需要数月。现在,具备正确基础设施的团队可以在一天或两天内完成实验和测试。但前提是:你得有正确的基础设施、有清晰的策略、知道该测试什么。
AI可以加速原型开发和实验执行,但无法替代战略决策和方向选择。
六、行动建议
建议一:本周开始“倾听之旅”
为什么要做:工具和自动化解决的是你想象中存在的问题,而不是团队真正面临的痛苦。只有通过对话才能发现真正的瓶颈。
如何开始:找三到五位开发者,问他们三个简单问题——昨天做了什么?哪些环节让你感到愉悦?哪些让你沮丧、慢下来或感到挫败?
能得到什么:你会发现一两个高影响、低投入的改进点,可能是某个流程、某个工具配置、或者某个被忽视的小痛点。
建议二:用满意度调查替代幸福感调查
为什么要做:幸福感太模糊,无法给出可操作的信号。满意度更聚焦,可以帮助我们定位具体问题。
如何开始:设计一份简短调查,包含三个维度——满意度评级(如对这个工具的满意度1-5分)、主要障碍(从给定列表中选择最多三个)、发生频率(每小时/每天/每周/每季度)。
能得到什么:一个可量化的基线数据,知道最大的挑战在哪里、影响有多频繁,可以据此排序改进优先级。
建议三:学会区分“速度”和“方向”
为什么要做:AI可以让你跑得更快,但如果方向错了,只会更快地做错事。战略决策永远是第一位的。
如何开始:每次讨论速度提升时,先问三个问题——我们在构建正确的东西吗?我们知道该优先做什么吗?我们的决策依据是什么?
能得到什么:避免“快速交付垃圾”的陷阱,确保速度提升真正转化为业务价值。
建议四:建立信任核查清单
为什么要做:AI生成的代码可能包含幻觉、风格不一致、逻辑错误。直接接受会引入技术债务和质量风险。
如何开始:为团队制定一个简单的核查清单——输出是否合理?是否符合代码风格?是否存在明显的逻辑错误?必要时补充单元测试。
能得到什么:更高的代码质量标准,更少的生产事故,团队对AI输出的信任建立在验证基础上而非假设之上。
建议五:用产品思维设计开发者体验
为什么要做:开发者体验本质上是一个产品,需要用户研究、MVP、迭代反馈,而不是一次性的大方案。
如何开始:识别你的“用户”(开发者)面临的核心问题,创建最小可行解决方案,在一个小团队试点,收集反馈,快速迭代。
能得到什么:一个持续改进的机制,而非一次性的项目,确保DX投入长期有效。
七、我的总结
Nicole Forsgren用一句话点破了AI时代开发者效能的本质:大多数团队都可以更快,但更快是为了什么?
在这场对话中,她揭示了一个重要真相——AI正在改变游戏规则,但它改变的不只是编码方式,更是整个开发体验的运行逻辑。代码行数变成了糟糕的代理指标,因为AI可以轻易生成海量代码。流程和流程中的摩擦比工具本身更重要。信任成为了新的必备维度,因为每个AI输出都需要验证。开发者正在变成协调者而非执行者,而这要求更高层次的思考能力。
她的SPACE框架在AI时代依然有效,但需要加入“信任”这个新维度。她的七步框架——从倾听开始、找到快速胜利、用数据优化、确定策略优先级、推销策略、推动变革、评估进展——为任何想要改善开发者体验的团队提供了清晰的路径。
最重要的是:答案往往就在你的团队中。去听,去问,然后动手做。
新书《Frictionless》可在 developerexperiencebook.com 获取,包含近100页的工作手册和实用调查模板。
📺 播客信息
- 发布时间:2025-10-19
- 时长:1小时7分钟48秒
- 播放量:17057 次观看
- 原版视频:『YouTube』