“AI教母”李飞飞：技术从来都是双刃剑，但选择权始终在人类手中

嘉宾：李飞飞博士（Dr. Fei-Fei Li）｜ AI先驱、斯坦福大学教授、World Labs创始人｜领域：人工智能与空间智能

一段跨越三十年的冒险之旅

很多人第一次听说李飞飞，是在近两年的新闻里。但鲜有人知道，就在不到十年前，如果你向一家科技公司提议把”AI”这个词放进公司名称里，他们的公关团队可能会当场翻脸。2015到2016年间，AI还是一个敏感词——没人确定它是不是一个”脏词”。直到2017年左右，公司们才开始正式宣称自己是AI公司。

而此刻，全球最顶尖的AI科学家之一，被称为”AI教母”的李飞飞博士，正坐在我们对面的镜头前。她是ImageNet的缔造者，正是这个数据集在2012年点燃了现代AI革命的引信，直接促成了深度学习的爆发，进而催生了ChatGPT这样的划时代产品。她曾任谷歌云AI首席科学家、斯坦福AI实验室主任，如今又创立了World Labs，并刚刚推出了全球首个大型世界模型Marble。

当被问及为什么在AI领域深耕二十五年后依然保持乐观时，李飞飞的回答既谦逊又坚定：

“我不是乌托邦主义者。技术从来都是双刃剑。但我相信，从人类发展的漫长历程来看，我们是一个具有创新精神的物种——几千年前我们就在发明工具，今天依然如此。AI是这个进程的延续，它能让我们生活得更好、工作得更有效率。”

她补充道：“无论AI最终带来什么，都取决于我们自己。“

一、她是谁：站在AI革命中心的女人

李飞飞的职业轨迹，本身就是一部AI发展简史。

2000年，她在加州理工学院攻读博士期间，选择了一条当时几乎无人问津的道路——用视觉智能的视角切入人工智能研究。她敏锐地意识到，人类是深度依赖视觉的动物，我们理解世界的底层逻辑建立在视觉、感知和空间认知之上，而非仅仅是语言。

那时，AI领域正处于所谓的”寒冬期”。学术资助缩减，公众对AI持怀疑态度，神经网络被认为是一个死胡同。但李飞飞和她的学生们坚持认为，AI缺少的不是更精妙的数学模型，而是足够大规模的高质量数据。

2006到2007年间，她和团队启动了ImageNet项目。这个项目的野心听起来近乎疯狂：收集互联网上的所有图片，建立一个涵盖22000个概念、1500万张图片的数据库，并将其开源给整个研究社区。为了实现这个目标，一个教授和几个研究生几乎凭一己之力完成了原本需要一整个机构来做的事情。

2012年，加拿大多伦多大学的Geoff Hinton团队使用ImageNet数据集和两块游戏显卡（没错，就是游戏玩家用来玩游戏的普通显卡），训练出了第一个突破性的卷积神经网络算法。这就是著名的AlexNet，它的成功证明了”大数据+神经网络+GPU算力”这个黄金配方能够大幅提升图像识别的准确率。

从这一刻起，现代AI的三大核心要素已经成型：大规模数据、深度神经网络架构、强大的GPU算力。十二年后，当ChatGPT横空出世时，它的底层技术逻辑依然是这三条——只不过数据规模从图像扩展到了互联网文本，模型复杂度从简单的卷积网络升级到了Transformer，而算力则从两块游戏显卡扩展到了无法想象的量级。

二、核心观点TOP10

1. AI的影响取决于我们自己 李飞飞明确表示，她不是乌托邦主义者。技术是双刃剑，AI最终是好是坏，“都取决于人，取决于我们作为个体、作为社会做出的选择”。

2. 每一次技术革命都有黑暗面 回顾人类历史，每一次重大技术突破都伴随着风险。AI也不例外。如果社会和个人没有做出正确的选择，技术完全可能被滥用。

3. “人工智能”这个词里没有任何人工的成分 她在多次国会听证中说过这句话：AI受人类启发、由人类创造、最重要的是，它在深刻地影响着人类。“当我的学生毕业时，我都会提醒他们——你们研究的领域叫做人工智能，但它里面没有任何人工的成分。”

4. 数据是现代AI被忽视的关键要素 早在2000年代，李飞飞就意识到，AI研究界过度关注模型算法本身，而忽视了训练数据的重要性。人类和动物的学习本质上是一个”大数据学习过程”——我们通过大量的经验不断积累认知。

5. AGI是一个营销术语，而非科学术语 面对”我们离通用人工智能还有多远”这个问题，李飞飞的回答是：没人能准确定义AGI。有人把它定义为机器的超级能力，有人定义为”机器能否通过工作赚取工资来谋生”。作为一个科学家，她说：“对我来说，AI本身就是北极星。AGI更多是一个营销概念，而非科学概念。”

6. 当前的AI离真正的人类智能还很遥远 李飞飞指出了一个令人清醒的事实：给AI一段两个办公室房间的视频，让它数一数里面有多少把椅子——这是任何学龄前儿童都能完成的任务，但今天最前沿的AI依然做不到。更不用说像牛顿那样，从天体运动数据中推导出统治宇宙的基本方程。当被问到如果给当今最强大的AI牛顿所没有的全部数据，让它推导出牛顿的运动定律，它能做到吗？李飞飞的回答是：“不能，情况甚至更糟。”

7. 空间智能是语言模型之后的下一次突破 李飞飞认为，语言模型已经展示了巨大的潜力，但人类的智能远远超出语言。我们在混乱的灾难现场进行救援、在厨房里整理物品、凭直觉避开障碍——这些能力建立在空间智能之上，而这是当前AI最大的短板。

8. 世界模型创造的是可探索的3D世界，而非2D视频 与Sora等视频生成模型不同，世界模型生成的是具有真实3D结构的虚拟世界，用户可以在其中自由行走、与之互动。这是机器理解物理世界的基础，也是机器人能够真正在现实世界中工作的前提。

9. 机器人需要的不只是”大脑”，还有身体和场景 李飞飞借用自动驾驶汽车的历史来类比：2005年DARPA挑战赛的自动驾驶原型，到今天二十年后，我们依然没有完全解决无人驾驶问题——而汽车只是2D平面上移动的金属盒子。机器人是3D空间中的实体，要与物理世界交互，这个旅程只会更加漫长。

10. 人类的大脑只需要20瓦功率 “我现在头顶的灯泡可能都比我的大脑耗电多。“李飞飞说，“但人类能够完成极其复杂的任务。每当我深入研究AI，反而更加敬畏人类自身。“

三、关键洞察

1. “苦涩的教训”对机器人不够用

AI领域有一个著名的”苦涩的教训”（Bitter Lesson），出自强化学习先驱Richard Sutton：回顾AI发展史，简单模型配合大规模数据，最终总是打败复杂模型配合少量数据。这个结论促使李飞飞在2009年就创建了ImageNet。

但李飞飞指出，这个教训在机器人领域面临特殊挑战：

语言模型的训练数据（文本）和输出（文本）之间是完美对齐的。但机器人需要在3D世界中执行动作，而我们的训练数据严重缺乏这种”在3D世界中行动”的大规模样本。虽然互联网视频提供了一些帮助，但远远不够——我们需要遥操作数据、合成数据来补充，而整个领域还处于早期探索阶段。

更根本的是，机器人是物理系统，它们更接近自动驾驶汽车，而非语言模型。这意味着要让机器人真正工作，我们不仅需要”大脑”（AI算法），还需要身体（硬件）和应用场景（真实环境）。这让机器人领域的进展注定比软件领域更加漫长和艰难。

2. 世界模型代表着AI的新范式

当大多数公司还在军备竞赛般地发布更大的语言模型时，李飞飞已经转向了一个不同的方向：世界模型。

什么是世界模型？简单来说，语言模型处理的是序列化的文本token，而世界模型处理的是3D空间中的物体、运动和交互。当用户描述一个场景时，世界模型能够生成一个具有真实物理结构的虚拟世界，用户可以在其中自由行走、拾取物体、改变环境——而这一切都遵循着与真实世界一致的物理规律。

李飞飞分享了一个来自DNA双螺旋结构发现的故事： Rosalind Franklin拍摄的那张X射线衍射照片是2D的，但Watson和Crick凭借它和人类特有的3D空间推理能力，推导出了DNA的双螺旋结构——一个本质上3D的结构。这种空间智能不仅对机器人至关重要，对于科学发现同样不可或缺。

3. 创业需要的是热情，而非精算

作为一位52岁才创立World Labs的创始人，李飞飞给年轻人的建议出人意料地直接：“我经常在面试中发现，优秀的年轻人才会在决定工作时过度分析每一个变量——薪酬、股权、地点、发展空间……但有时候，你最需要问自己的是：你的热情在哪里？你是否认同这个使命？你是否相信这个团队？”

她坦诚地承认，创立World Labs后，AI领域的人才竞争和整个生态的激烈程度还是让她感到意外。“当我在2023年中期创立公司时，我们没有预料到某些顶级人才的薪酬会达到怎样的水平。”

但她的核心原则从未改变：找到有共同热情的人，做一件有意义的事，不要过度担心失败的可能性。“当你想要做出改变时，你几乎必须允许自己无畏、允许自己勇敢。“

四、精彩金句

“There’s nothing artificial about artificial intelligence.” （人工智能里没有任何人工的成分。）

这句话是李飞飞在国会作证时的原话。“当我看到学生从我的实验室毕业时，我都会提醒他们：你们研究的领域叫做人工智能，但里面没有任何人工的成分。它由人启发、由人创造、最终影响人。”

“Whatever AI does in currently or in the future is up to us. It’s up to the people.” （AI当前和未来做什么，都取决于我们，取决于人。）

在谈到AI是否会抢走工作时，李飞飞明确表示自己不是乌托邦主义者——她承认AI会带来冲击，但她相信最终的结果取决于人类集体的选择。技术是工具，如何使用工具，决定权在人类手中。

“If you are a young artist and your passion is storytelling, embrace AI as a tool.” （如果你是一个热爱讲述故事的年轻艺术家，就把AI作为一个工具来拥抱它。）

当被问及普通人如何面对AI时代时，李飞飞给出了一个温暖的回答：无论你是音乐家、教师、护士、农民、还是任何人，AI都不会剥夺你的价值和尊严。关键在于找到你的热情，然后用AI这个工具去更有效地实现它。“你的声音，这个世界依然需要。”

“The more I work in AI, the more I respect humans.” （我越深入研究AI，就越敬畏人类。）

人类的大脑只需要大约20瓦的功率，比一盏台灯还低，但能够完成ChatGPT都无法企及的任务。李飞飞认为，理解AI的局限性，反而让我们更加珍惜人类自身的智能。

五、实战案例：Marble的世界

2024年底，李飞飞创立的World Labs推出了Marble——全球首个大型生成式世界模型。用户只需要输入一段文字描述或一张图片，Marble就能生成一个完整的3D虚拟世界，用户可以在其中自由行走、探索、与之互动。

这个产品已经展现了多个令人兴奋的应用场景：

虚拟制作（Virtual Production）：Marble团队与索尼合作，使用Marble生成的3D场景制作了一部短片。合作的电影制作团队表示，Marble将他们的制作效率提升了40倍以上。在传统流程中，创建这样的虚拟场景需要数月时间，而Marble让他们在有限的项目周期内完成了大量镜头。

游戏开发：开发者们已经开始将Marble生成的场景导出并开发成游戏。无论是VR游戏还是普通的互动游戏，Marble都大幅降低了创建虚拟世界的门槛。

机器人训练：对于李飞飞自己的研究领域而言，Marble解决了长期困扰机器人研究的一个痛点——合成数据的生成。训练机器人需要大量多样化的3D环境，而Marble能够快速生成这些环境，大幅加速机器人学习物理世界的过程。

心理学研究：一个意想不到的用户案例是心理学研究团队。他们需要向研究对象展示各种沉浸式场景——混乱的房间、整洁的房间、不同特征的空间——来观察大脑的反应。在传统方式下，创建这些场景既耗时又昂贵，而Marble几乎可以即时生成所需的实验环境。

李飞飞分享了一个有趣的细节：用户进入Marble世界时，会先看到一串粒子（dots）逐渐汇聚，最终呈现出完整的3D场景。这个”粒子汇聚”的效果原本是为了引导用户理解正在发生的事情，但用户们普遍反馈这是”令人愉悦”的体验——一个小小的设计选择，意外地增加了产品的温度。

六、行动建议

1. 不要把AI看作威胁，而是看作工具 无论你从事什么职业，AI都将深刻影响你的工作和生活。与其焦虑于”AI会不会取代我”，不如思考”如何利用AI让我做得更好”。正如李飞飞所说：“你的声音，这个世界依然需要。而问题是，你如何用最强大的工具来表达它。”

如何开始：在你的专业领域，寻找一个AI工具（比如写作助手、图像生成、数据分析），用一个月时间把它融入你的日常工作流程。

2. 关注数据的质量，而非模型的规模 李飞飞的成功很大程度上源于她对”大数据+高质量标注数据”的洞察。即使在今天，高质量的训练数据依然是AI系统的关键瓶颈。

如何开始：如果你在构建AI应用，投入时间设计数据收集和标注流程；如果你是AI用户，理解你使用的工具背后依赖什么样的数据。

3. 保持对人类智能的敬畏，同时追求技术进步 李飞飞在工作中不断被人类大脑的精妙所震撼——20瓦的功耗就能完成远超当前AI的任务。这提醒我们，技术进步不应该让我们忘记自身的价值。

如何开始：每周留出时间思考技术之外的事情——人际关系、创造性表达、身体健康。这些是AI无法替代的人类核心能力。

4. 在选择工作时，关注热情和使命，而非短期利益 李飞飞在斯坦福放弃终身教职、离开谷歌创立World Labs，每一次选择都基于”我想做这件事”的内在驱动力，而非外部的薪酬或地位。

如何开始：当你面临重大职业选择时，问自己：“五年后，我会为这个选择感到骄傲吗？“而非”哪个选项能给我更高的薪水？”

5. 相信科技是人类的长期盟友 即使对AI的短期影响持谨慎态度，李飞飞依然相信技术是人类文明发展的核心驱动力。回顾历史，人类始终在通过创新工具改善自己的生活。

如何开始：不要被短期波动（比如某次AI失误、某项新法规）过度干扰，保持对人类创新能力的信心，同时积极地参与塑造技术的未来方向。

七、我的总结

在这场对话中，李飞飞展现了一个顶级科学家罕见的坦诚和温度。她没有回避AI的风险和挑战，也没有过度炒作技术的潜力。她承认当前的AI距离真正的人类智能还很遥远——它甚至无法完成一个孩子都能完成的”数一数视频中有几把椅子”的任务。但她依然保持着清醒的乐观：“AI最终会成为什么，取决于我们每一个人。”

她创立World Labs、推出Marble，不是为了打造另一个追逐规模的大模型公司，而是为了解决一个她认为当前AI最大的盲点：空间智能。当语言模型已经展示了巨大的潜力时，李飞飞看到了更远处——那些需要理解物理世界、与3D环境交互、从而真正帮助人类完成实际任务的智能系统。

对于每一个正在适应AI时代的普通人，李飞飞传递的核心信息是：你是参与者，不是旁观者。无论你是艺术家、护士、农民还是任何其他职业，AI的发展需要你的声音、你的参与、你的选择。技术从来都是双刃剑，但剑柄始终握在人类手中。

相关链接：

World Labs官网：worldlabs.ai
Marble体验入口：marble.worldlabs.ai

📺 播客信息

发布时间：2025-11-16
时长：1小时19分钟34秒
播放量：154966 次观看
原版视频：『YouTube』