AI编程的"十一月的拐点":从Vibe Coding到暗工厂,我们已经回不去了
AI编程的”十一月的拐点”:从Vibe Coding到暗工厂,我们已经回不去了
嘉宾:Simon Willson|Django 框架创始人、著名开源工程师|领域:AI 产品与软件工程
背景与引子
2025年11月,一批软件工程师在圣诞假期里有了同一个顿悟时刻:当他们把新模型扔给编程智能体时,代码竟然”大部分都能用了”。
这个”大部分能用”听起来平平无奇,但在此之前,你让AI写代码,它给你一堆bug,你需要自己运行、自己debug、自己测试——等于没省多少事。而从那一刻起,工程师们意识到:那个”需要人工兜底”的阶段,可能已经翻篇了。
Simon Willson是最早、最彻底地把整个工作流切换到AI辅助模式的顶级工程师之一。他创办了Django框架(Instagram、Pinterest、Spotify的幕后功臣),发明了”提示注入”(Prompt Injection)这个词,也因为在博客上实时分享自己用AI编程的所有经验而走红。他的博客每周更新,详细记录自己如何用AI在手机上写代码、如何同时跑四个智能体并行工作、以及他为什么认为一场”AI挑战者号灾难”迟早会来。
这场对话信息密度极大,几乎每个段落都值得单独展开讨论。以下是我从这场对话中提炼出的核心内容。
一、Simon Willson是谁
Simon Willson是开源世界的传奇人物。他共同创建了Django web框架——你今天用的Instagram、Pinterest、Spotify,背后都有Django在支撑。他还是Datasette的作者,这款数据分析工具已经成为调查记者的标配。
但真正让他在2025-2026年变得格外重要的,是他做了一件很少工程师能做到的事:完整、透明、实时地把自己从”传统编程”切换到”AI辅助编程”的全过程记录下来。他的博客没有出版社、没有截稿日期,写到哪算哪,但每一篇都是实打实的实战复盘。他用AI写代码、用AI做研究、用AI构思产品——他不是在评论AI,他在使用AI。
这就是为什么连Lenny都说他是最”接地气”的AI思想者之一:Simon的洞察不是来自ppt,而是来自每天和最新模型厮杀的实战经验。
二、核心观点TOP10
-
“十一月的拐点”已经到来:2025年11月,GPT-5.1和Claude Opus 4.5发布,AI编程能力从”大部分能用”跃升到”几乎都能用”,这是一个量变到质变的临界点。
-
代码已经变得廉价:过去需要两天写的功能,现在可能只需要20分钟。代码的生产成本发生了根本性改变,这意味着整个工作流程需要重新设计。
-
Vibe Coding不等同于专业编程:非程序员让AI画个小应用,这叫Vibe Coding;专业工程师用AI构建生产级代码,这叫”智能体工程”(Agentic Engineering)。两个东西差别巨大,混淆它们会让我们失去一个有价值的词汇。
-
暗工厂模式是下一个前沿:当代码可以无人撰写、无需阅读,那软件开发会变成什么样?StrongDM这家公司已经在实践”无人阅读代码”的政策,靠模拟测试团队来保证质量。
-
AI是已有技能的放大器,不是无中生有:Simon能用AI如此高效,是因为他有25年的工程经验可以”投放”进去。AI把经验放大,而不是替代经验。
-
中间层工程师处境最尴尬:新手工程师借助AI可以一周内上手(Cloudflare和Shopify雇了上千名实习生都这么说);超级资深工程师用AI放大能力;但中间那层——不够资深但也不再是新手——是真正需要思考出路的人。
-
人类最后的护城河是”代理权”(Agency):AI没有动机、没有欲望、不知道什么该做不该做。人类的代理权——决定做什么、朝哪个方向走——是AI无法取代的。
-
测试驱动开发从未如此重要:没有测试,你就不知道AI生成的代码是否真的在运行。AI可以批量生成测试,让测试变得廉价,这意味着你可以拥有更完整的测试覆盖。
-
提示注入问题无法被彻底解决:只要模型把”指令”和”数据”放在同一个文本序列里,攻击者就永远有缝隙可钻。97%的过滤率等于3%的数据泄露,这不是可接受的答案。
-
AI最危险的不是技术问题,而是”正常化偏差”:我们正在用越来越不安全的方式使用这些系统,每次没出事都会让自己更自信——直到灾难发生。这和挑战者号航天飞机的O型环问题一模一样。
三、关键洞察
洞察一:AI让最有野心的人工作得更辛苦,而不是更轻松
按照常理,AI应该解放我们,让我们有更多时间休息。但Simon观察到一个反直觉的现象:最深度使用AI的那批人,比以往任何时候都更拼命。原因有几个——他们的智能体正在后台运行,他们怕错过机会,他们想把堆积了十年的Side Project全部清空。这种工作强度不可持续,但又是真实的。解决方案不是少用AI,而是找到自己的节奏和边界。
洞察二:中间层工程师面临最大挑战,但不是没有出路
ThoughtWorks组织了一场由多个公司工程VP参加的闭门讨论,结论是:初级工程师借助AI快速成长,高级工程师用AI放大优势,而中间层——还没到”超级资深”但也不是新手的工程师——处境最尴尬。他们没有足够的经验来指导AI行为,但也已经不是”刚入门”的状态了。Simon的答案是:去积累更多、更广的实际经验,AI能帮你快速试验、快速学习,关键是别停在原地。
洞察三:“暗工厂”不只是关于自动化,而是关于信任
StrongDM在做一件听起来很疯狂的事:工程师不能自己写代码(必须由AI写),代码写完后也没人读。那怎么保证质量?他们的答案是:用一大群AI模拟用户,24小时不间断地使用系统,发现bug。换句话说,他们用无限多的”虚拟QA”替代了代码审查。这揭示了一个核心问题:当代码生产变得极度自动化,我们需要全新的质量保障范式。
洞察四:提示注入本质上是一个无法关闭的漏洞
Simon在2022年就定义了”提示注入”这个词,但他现在后悔了——因为这个名字让人们误以为可以用类似解决SQL注入的方式来解决它。现实是:LLM无法区分”你的指令”和”别人输入的内容”,只要这两者混在一个文本序列里,攻击永远可能发生。你能做的不是彻底防御,而是缩小爆炸半径——限制智能体可以执行的操作范围。
洞察五:品味正在成为选择模型的真正标准
Simon用Claude还是GPT,并不是因为哪个模型在benchmark上更好,而是因为Claude生成的代码”品味”更合他的心意——代码风格、结构、风格都和他想要的一致。这个细节很少被讨论,但它可能是未来留住用户的核心因素:模型的技术指标会趋同,但”代码风格”这种软性特质,才是真正的差异化所在。
四、精彩金句
“代码廉价了,但你想要的不是廉价代码——你想要的是好代码。”
“使用这些工具很容易,用好这些工具则需要多年的经验积累和大量试错。”
“AI没有任何代理权,因为它没有人类那样的动机。你来决定做什么,它来执行——这个分工在未来依然有效。”
“当你告诉AI’用红/绿TDD方法’时,你用五个字替代了几百字的描述,而且它完全理解。”
“我写代码用手机,在海滩遛狗的时候就能完成高质量的工作——这太疯狂了。”
“Open Claw本质上是一个数字宠物,你买一台Mac Mini当作鱼缸,它就住在里面。“
五、实战案例
案例一:StrongDM的暗工厂实验
这家公司做的是企业访问管理(Access Management)软件——非常敏感的安全领域。他们制定了一条政策:没人可以直接写代码,所有代码必须由AI生成。然后更进一步:没人需要读代码。怎么保证质量?他们的做法是构建了一个完全模拟的环境——模拟Slack、模拟Jira、模拟Okta——然后用AI模拟一批”虚拟员工”,24小时不停地发起权限申请、发送工单、触发各种使用场景。每天烧掉一万美元token,但换来了一个从不睡觉的QA团队。软件发布前已经在无数种场景下被测试过。这不是”偷懒”,这是一种全新的质量保障思路。
案例二:Simon的模板启动法
Simon在启动任何新项目时,第一步不是写需求文档,而是创建一个”模板”——里面只有一个测试:验证1+1=2。这个测试的风格、注释格式、文件夹结构都符合Simon的偏好。为什么要这样做?因为编程智能体对”既有风格”的遵循能力极强,只要给一个样本,它们就能完美复制。Simon有三个模板:Python库模板、数据集插件模板、命令行工具模板。每个项目从模板开始,效果出奇地好。
案例三:Pelican on Bicycle基准测试
Simon发明了一个”pelican riding a bicycle”(一只骑自行车的鹈鹕)作为测试LLM空间推理能力的benchmark。这个测试不是测图像生成模型,而是测文本模型生成SVG的能力。越好的模型画出的鹈鹕越生动。更诡异的是:哪个模型画鹈鹕画得更好,它在其他所有任务上的表现也更好——两者之间存在强烈的相关性,没人能解释原因。这个benchmark已经成为AI圈的meme,连Anthropic和OpenAI都会在发布新模型时专门展示鹈鹕。
六、行动建议
建议一:如果你还在抗拒AI编程,现在是时候认真试一试了
Simon说,“代码现在已经是好代码了”——这个借口已经不存在了。你不需要用AI替代全部工作,但至少应该在真实项目中尝试一下。哪怕每周只让AI帮你完成一个小功能,也比观望一年强。推荐从Claude Code或OpenAI Codex开始,选择一个你自己写的项目,用AI辅助重构一个模块。
建议二:建立你自己的”工具箱仓库”和”研究仓库”
Simon有两个GitHub仓库:simonw/tools(193个HTML/JS小工具)和simonw/research(AI驱动的编程实验报告)。每个仓库都在积累”可以组合的积木”。对于你来说,不必复制他的仓库形式,但找到一种方式记录你做过的尝试、解决过的问题、实验过的技术——这将成为你和AI协作时的强大素材库。关键是把”已尝试”变成”已知可行”,让AI在解决新问题时能找到参考。
建议三:用红/绿TDD来约束你的编程智能体
当你让AI写代码时,告诉它”使用红/绿TDD方法”——即先写测试看它失败,再写实现让它通过。这六个字会让AI的执行质量大幅提升,因为它强制AI先运行代码、先看到错误。很多人在使用编程智能体时遇到的”看似成功实际有bug”的问题,很大程度上是因为跳过了测试环节。自动化测试不仅是质量保障手段,也是让AI真正”跑起来”的关键。
建议四:重新审视你的野心边界
Simon今年的新年决心是”接更多的活,做更野心的事”——这和他以前每年说”我要更专注、接更少的事”完全相反。原因很简单:代码变廉价了,很多以前觉得”不值得做”的项目现在完全值得做。你需要重新评估自己能力的边界,然后把它向外推一步。不要等着AI替你做决定,而是主动去尝试那些你以前觉得”不太可能”的项目。
建议五:认真对待提示注入风险,不要把私人数据交给不受信任的Agent
如果你正在考虑使用类似Open Claw的个人AI助手,请确保它运行在一个隔离环境中。Simon的做法是:把Open Claw部署在Docker容器里,只给它独立的邮箱,不把自己的真实邮件接入。他有25年的安全工程经验,知道什么可以冒险、什么不行。但对于大多数人来说,“把个人数据交给AI”这件事需要更谨慎的评估。记住:只要一个Agent同时拥有私人信息、能接收外部指令、有发送消息的能力,这就是Simon所说的”致命三合一”——一个随时可能被攻击的定时炸弹。
七、我的总结
Simon Willson给我们的最大价值,不是某个具体的技巧或工具,而是一种面对AI时代的姿态:保持好奇、保持实验、保持透明。他把自己的所有尝试都公开写出来,把代码都开源,把踩过的坑都记录——因为他知道这个转变太大了,任何个人都无法独自摸索出完整地图。
最让我印象深刻的一个细节是:Simon现在95%的代码不是自己打的——但他仍然会为这些代码感到自信,因为他的测试足够完整、他的模板足够清晰、他的工作流程足够成熟。这说明了一个核心事实:AI不会让你失业,但会让你失业的方式发生变化。与其担心”AI会不会替代我”,不如认真思考”在AI可以廉价产出代码的时代,什么才是真正有价值的”——答案是:对问题的判断、对方向的决策、以及那个永远无法被自动化的”代理权”。
📺 播客信息
- 发布时间:2026-04-02
- 时长:1小时39分钟51秒
- 播放量:180754 次观看
- 原版视频:『YouTube』