AI编程的”十一月的拐点”：从Vibe Coding到暗工厂，我们已经回不去了

嘉宾：Simon Willson｜Django 框架创始人、著名开源工程师｜领域：AI 产品与软件工程

背景与引子

2025年11月，一批软件工程师在圣诞假期里有了同一个顿悟时刻：当他们把新模型扔给编程智能体时，代码竟然”大部分都能用了”。

这个”大部分能用”听起来平平无奇，但在此之前，你让AI写代码，它给你一堆bug，你需要自己运行、自己debug、自己测试——等于没省多少事。而从那一刻起，工程师们意识到：那个”需要人工兜底”的阶段，可能已经翻篇了。

Simon Willson是最早、最彻底地把整个工作流切换到AI辅助模式的顶级工程师之一。他创办了Django框架（Instagram、Pinterest、Spotify的幕后功臣），发明了”提示注入”（Prompt Injection）这个词，也因为在博客上实时分享自己用AI编程的所有经验而走红。他的博客每周更新，详细记录自己如何用AI在手机上写代码、如何同时跑四个智能体并行工作、以及他为什么认为一场”AI挑战者号灾难”迟早会来。

这场对话信息密度极大，几乎每个段落都值得单独展开讨论。以下是我从这场对话中提炼出的核心内容。

一、Simon Willson是谁

Simon Willson是开源世界的传奇人物。他共同创建了Django web框架——你今天用的Instagram、Pinterest、Spotify，背后都有Django在支撑。他还是Datasette的作者，这款数据分析工具已经成为调查记者的标配。

但真正让他在2025-2026年变得格外重要的，是他做了一件很少工程师能做到的事：完整、透明、实时地把自己从”传统编程”切换到”AI辅助编程”的全过程记录下来。他的博客没有出版社、没有截稿日期，写到哪算哪，但每一篇都是实打实的实战复盘。他用AI写代码、用AI做研究、用AI构思产品——他不是在评论AI，他在使用AI。

这就是为什么连Lenny都说他是最”接地气”的AI思想者之一：Simon的洞察不是来自ppt，而是来自每天和最新模型厮杀的实战经验。

二、核心观点TOP10

“十一月的拐点”已经到来：2025年11月，GPT-5.1和Claude Opus 4.5发布，AI编程能力从”大部分能用”跃升到”几乎都能用”，这是一个量变到质变的临界点。
代码已经变得廉价：过去需要两天写的功能，现在可能只需要20分钟。代码的生产成本发生了根本性改变，这意味着整个工作流程需要重新设计。
Vibe Coding不等同于专业编程：非程序员让AI画个小应用，这叫Vibe Coding；专业工程师用AI构建生产级代码，这叫”智能体工程”（Agentic Engineering）。两个东西差别巨大，混淆它们会让我们失去一个有价值的词汇。
暗工厂模式是下一个前沿：当代码可以无人撰写、无需阅读，那软件开发会变成什么样？StrongDM这家公司已经在实践”无人阅读代码”的政策，靠模拟测试团队来保证质量。
AI是已有技能的放大器，不是无中生有：Simon能用AI如此高效，是因为他有25年的工程经验可以”投放”进去。AI把经验放大，而不是替代经验。
中间层工程师处境最尴尬：新手工程师借助AI可以一周内上手（Cloudflare和Shopify雇了上千名实习生都这么说）；超级资深工程师用AI放大能力；但中间那层——不够资深但也不再是新手——是真正需要思考出路的人。
人类最后的护城河是”代理权”（Agency）：AI没有动机、没有欲望、不知道什么该做不该做。人类的代理权——决定做什么、朝哪个方向走——是AI无法取代的。
测试驱动开发从未如此重要：没有测试，你就不知道AI生成的代码是否真的在运行。AI可以批量生成测试，让测试变得廉价，这意味着你可以拥有更完整的测试覆盖。
提示注入问题无法被彻底解决：只要模型把”指令”和”数据”放在同一个文本序列里，攻击者就永远有缝隙可钻。97%的过滤率等于3%的数据泄露，这不是可接受的答案。
AI最危险的不是技术问题，而是”正常化偏差”：我们正在用越来越不安全的方式使用这些系统，每次没出事都会让自己更自信——直到灾难发生。这和挑战者号航天飞机的O型环问题一模一样。

三、关键洞察

洞察一：AI让最有野心的人工作得更辛苦，而不是更轻松

按照常理，AI应该解放我们，让我们有更多时间休息。但Simon观察到一个反直觉的现象：最深度使用AI的那批人，比以往任何时候都更拼命。原因有几个——他们的智能体正在后台运行，他们怕错过机会，他们想把堆积了十年的Side Project全部清空。这种工作强度不可持续，但又是真实的。解决方案不是少用AI，而是找到自己的节奏和边界。

洞察二：中间层工程师面临最大挑战，但不是没有出路

ThoughtWorks组织了一场由多个公司工程VP参加的闭门讨论，结论是：初级工程师借助AI快速成长，高级工程师用AI放大优势，而中间层——还没到”超级资深”但也不是新手的工程师——处境最尴尬。他们没有足够的经验来指导AI行为，但也已经不是”刚入门”的状态了。Simon的答案是：去积累更多、更广的实际经验，AI能帮你快速试验、快速学习，关键是别停在原地。

洞察三：“暗工厂”不只是关于自动化，而是关于信任

StrongDM在做一件听起来很疯狂的事：工程师不能自己写代码（必须由AI写），代码写完后也没人读。那怎么保证质量？他们的答案是：用一大群AI模拟用户，24小时不间断地使用系统，发现bug。换句话说，他们用无限多的”虚拟QA”替代了代码审查。这揭示了一个核心问题：当代码生产变得极度自动化，我们需要全新的质量保障范式。

洞察四：提示注入本质上是一个无法关闭的漏洞

Simon在2022年就定义了”提示注入”这个词，但他现在后悔了——因为这个名字让人们误以为可以用类似解决SQL注入的方式来解决它。现实是：LLM无法区分”你的指令”和”别人输入的内容”，只要这两者混在一个文本序列里，攻击永远可能发生。你能做的不是彻底防御，而是缩小爆炸半径——限制智能体可以执行的操作范围。

洞察五：品味正在成为选择模型的真正标准

Simon用Claude还是GPT，并不是因为哪个模型在benchmark上更好，而是因为Claude生成的代码”品味”更合他的心意——代码风格、结构、风格都和他想要的一致。这个细节很少被讨论，但它可能是未来留住用户的核心因素：模型的技术指标会趋同，但”代码风格”这种软性特质，才是真正的差异化所在。

四、精彩金句

“代码廉价了，但你想要的不是廉价代码——你想要的是好代码。”

“使用这些工具很容易，用好这些工具则需要多年的经验积累和大量试错。”

“AI没有任何代理权，因为它没有人类那样的动机。你来决定做什么，它来执行——这个分工在未来依然有效。”

“当你告诉AI’用红/绿TDD方法’时，你用五个字替代了几百字的描述，而且它完全理解。”

“我写代码用手机，在海滩遛狗的时候就能完成高质量的工作——这太疯狂了。”

“Open Claw本质上是一个数字宠物，你买一台Mac Mini当作鱼缸，它就住在里面。“

五、实战案例

案例一：StrongDM的暗工厂实验

这家公司做的是企业访问管理（Access Management）软件——非常敏感的安全领域。他们制定了一条政策：没人可以直接写代码，所有代码必须由AI生成。然后更进一步：没人需要读代码。怎么保证质量？他们的做法是构建了一个完全模拟的环境——模拟Slack、模拟Jira、模拟Okta——然后用AI模拟一批”虚拟员工”，24小时不停地发起权限申请、发送工单、触发各种使用场景。每天烧掉一万美元token，但换来了一个从不睡觉的QA团队。软件发布前已经在无数种场景下被测试过。这不是”偷懒”，这是一种全新的质量保障思路。

案例二：Simon的模板启动法

Simon在启动任何新项目时，第一步不是写需求文档，而是创建一个”模板”——里面只有一个测试：验证1+1=2。这个测试的风格、注释格式、文件夹结构都符合Simon的偏好。为什么要这样做？因为编程智能体对”既有风格”的遵循能力极强，只要给一个样本，它们就能完美复制。Simon有三个模板：Python库模板、数据集插件模板、命令行工具模板。每个项目从模板开始，效果出奇地好。

案例三：Pelican on Bicycle基准测试

Simon发明了一个”pelican riding a bicycle”（一只骑自行车的鹈鹕）作为测试LLM空间推理能力的benchmark。这个测试不是测图像生成模型，而是测文本模型生成SVG的能力。越好的模型画出的鹈鹕越生动。更诡异的是：哪个模型画鹈鹕画得更好，它在其他所有任务上的表现也更好——两者之间存在强烈的相关性，没人能解释原因。这个benchmark已经成为AI圈的meme，连Anthropic和OpenAI都会在发布新模型时专门展示鹈鹕。

六、行动建议

建议一：如果你还在抗拒AI编程，现在是时候认真试一试了

Simon说，“代码现在已经是好代码了”——这个借口已经不存在了。你不需要用AI替代全部工作，但至少应该在真实项目中尝试一下。哪怕每周只让AI帮你完成一个小功能，也比观望一年强。推荐从Claude Code或OpenAI Codex开始，选择一个你自己写的项目，用AI辅助重构一个模块。

建议二：建立你自己的”工具箱仓库”和”研究仓库”

Simon有两个GitHub仓库：simonw/tools（193个HTML/JS小工具）和simonw/research（AI驱动的编程实验报告）。每个仓库都在积累”可以组合的积木”。对于你来说，不必复制他的仓库形式，但找到一种方式记录你做过的尝试、解决过的问题、实验过的技术——这将成为你和AI协作时的强大素材库。关键是把”已尝试”变成”已知可行”，让AI在解决新问题时能找到参考。

建议三：用红/绿TDD来约束你的编程智能体

当你让AI写代码时，告诉它”使用红/绿TDD方法”——即先写测试看它失败，再写实现让它通过。这六个字会让AI的执行质量大幅提升，因为它强制AI先运行代码、先看到错误。很多人在使用编程智能体时遇到的”看似成功实际有bug”的问题，很大程度上是因为跳过了测试环节。自动化测试不仅是质量保障手段，也是让AI真正”跑起来”的关键。

建议四：重新审视你的野心边界

Simon今年的新年决心是”接更多的活，做更野心的事”——这和他以前每年说”我要更专注、接更少的事”完全相反。原因很简单：代码变廉价了，很多以前觉得”不值得做”的项目现在完全值得做。你需要重新评估自己能力的边界，然后把它向外推一步。不要等着AI替你做决定，而是主动去尝试那些你以前觉得”不太可能”的项目。

建议五：认真对待提示注入风险，不要把私人数据交给不受信任的Agent

如果你正在考虑使用类似Open Claw的个人AI助手，请确保它运行在一个隔离环境中。Simon的做法是：把Open Claw部署在Docker容器里，只给它独立的邮箱，不把自己的真实邮件接入。他有25年的安全工程经验，知道什么可以冒险、什么不行。但对于大多数人来说，“把个人数据交给AI”这件事需要更谨慎的评估。记住：只要一个Agent同时拥有私人信息、能接收外部指令、有发送消息的能力，这就是Simon所说的”致命三合一”——一个随时可能被攻击的定时炸弹。

七、我的总结

Simon Willson给我们的最大价值，不是某个具体的技巧或工具，而是一种面对AI时代的姿态：保持好奇、保持实验、保持透明。他把自己的所有尝试都公开写出来，把代码都开源，把踩过的坑都记录——因为他知道这个转变太大了，任何个人都无法独自摸索出完整地图。

最让我印象深刻的一个细节是：Simon现在95%的代码不是自己打的——但他仍然会为这些代码感到自信，因为他的测试足够完整、他的模板足够清晰、他的工作流程足够成熟。这说明了一个核心事实：AI不会让你失业，但会让你失业的方式发生变化。与其担心”AI会不会替代我”，不如认真思考”在AI可以廉价产出代码的时代，什么才是真正有价值的”——答案是：对问题的判断、对方向的决策、以及那个永远无法被自动化的”代理权”。

📺 播客信息

发布时间：2026-04-02
时长：1小时39分钟51秒
播放量：180754 次观看
原版视频：『YouTube』