X的Community Notes内部揭秘:一个改变互联网信息生态的产品故事
嘉宾:Keith Coleman、J Bter|Community Notes产品负责人与创始机器学习工程师|领域:AI产品与信息治理
背景与引子
2024年,Meta宣布采用Community Notes系统作为其主要的事实核查工具。这个消息在科技圈和媒体圈引发了广泛讨论——一个最初只是Twitter内部实验性项目的产品,如今正在成为整个互联网解决虚假信息的行业标准方案。
你可能每天都在X(原Twitter)上看到这个功能:当一条推文下方出现一行标注,说”这条推文包含误导性信息”或”这个图片实际来自五年前的不同地点”,那就是Community Notes。这个看似简单的产品背后,藏着一个极具颠覆性的设计理念——让人类自己来判断什么是真相,而不是依赖传统的事实核查机构或平台审核团队。
我们今天要讲的,是这个产品如何从”看起来不可能成功”的疯狂想法,变成了一个每天产生数百条标注、被观看超过300亿次、正在重塑互联网信息生态的系统。更重要的是,我们会深入探讨它背后的产品哲学、团队运作方式,以及为什么它在经历了四任不同CEO(包括马斯克本人)之后依然存活并不断壮大。
一、嘉宾是谁
Keith Coleman是Community Notes的产品负责人,也是这个项目的发起者。在加入Twitter之前,他曾是云存储公司Dropbox的产品团队负责人。2016年,他看到Twitter成为美国大选期间每天都在发生的”辩论场”,意识到这个平台既是优质信息的来源,也是虚假信息的温床,但没有人真正解决了这个问题。他带着这个问题加入Twitter,花了三年时间帮助公司实现增长,然后在2020年开始全职投入Community Notes的开发。
J Bter是Community Notes的创始机器学习工程师和研究员。在加入这个项目之前,他已经积累了丰富的机器学习系统构建经验。他设计的算法是Community Notes能够正常运行的核心——一个被称为”基于桥接的协议算法”(bridging-based agreement algorithm)的系统,它能够从大量用户的评分中识别出真正有价值的标注,同时抵御来自各方的操纵和偏见。
这两位嘉宾的共同特点是:他们都相信”人类可以被信任来判断真相”,并愿意用一个极具风险的实验来验证这个假设。
二、核心观点TOP10
-
Community Notes的核心机制是寻找”跨分歧的协议”。 一个标注是否能被展示,不取决于多数人的同意,而是看那些平时观点对立的人是否都认为这条标注有帮助。
-
虚假信息每天的生产规模远超任何人工核查团队的处理能力。 2024年,Community Notes每天产生数百条标注,而传统事实核查每天只有约10条。
-
透明是信任的基础。 整个算法代码和评分数据全部开源,任何人都可以下载并自行验证系统是否公正运行。
-
匿名反而带来了更诚实的评分。 研究发现,当人们不需要公开自己立场时,他们更愿意跨越党派分歧给出真实评价。
-
标注不会降级推文的算法排名,只是让人自己决定是否转发。 结果是看到标注后的用户,转发率下降50%到60%。
-
每个人都可以参与,无论你是普通用户还是政府官员。 任何帖子都可能被打上标注,包括埃隆·马斯克的推文、广告主的内容、媒体机构的报道。
-
质量比数量重要。 目前大约8%的标注会被展示,其余92%中有很多并非不好,只是还未达到”两侧用户都认为有帮助”的严格标准。
-
产品早期通过小规模试点验证假设,逐步扩大规模。 从最初的1000名贡献者到如今近百万参与者,每一步都有数据支撑。
-
团队保持极简结构和极高自主权。 从最初的5人团队到今天的运营模式,他们用Google文档管理项目,几乎不用任何重型项目管理工具。
-
Community Notes的成功证明了人类社会的共识能力。 在极度对立的政治议题上,人们依然能够就客观事实达成一致,这比我们想象的更普遍。
三、关键洞察
洞察1:真相不需要权威背书,需要的是公正的机制
我们通常认为,判断信息真伪需要”专家”或”权威机构”。但Community Notes的设计假设与此相反:它相信当两个平时针锋相对的人同时认为一条信息有帮助时,这条信息大概率是客观准确的。这个设计巧妙地利用了人类的两极化倾向本身,作为识别真相的工具。
这种洞察的颠覆性在于:它不是让”正确的人”来判断,而是让”不同意见的人”来验证。这从根本上绕开了”谁来决定谁是正确的”这个无解问题。
洞察2:匿名不是漏洞,而是功能
项目早期,团队假设贡献者需要使用真实身份才能建立信任。但实际测试后发现:匿名用户更愿意在争议性话题上给出真实评价,因为他们不会被”站队”的社交压力所束缚。这与我们在其他场景中看到的现象一致——当点赞设为私密后,人们会点赞更多”不那么主流”的内容。
这提醒我们:在设计社区产品时,“真实”比”透明”更重要。匿名让人卸下伪装,暴露出更真实的判断。
洞察3:极简团队反而能做出更大影响
当Keith放弃管理职位,从零开始组建5人团队时,他的判断是:大规模团队生产的是”更多文档和OKR”,而小团队才能真正推动世界。这个判断在Community Notes上得到了验证——它成为行业标准的事实核查方案,影响了Meta等公司的决策。
这与传统的”团队越大产出越多”观念相悖。真正的产出来自专注和速度,而不是规模。
洞察4:平台不应该成为真相的裁决者
传统的事实核查模式是由平台内部团队或第三方机构来判断信息真伪。但Community Notes的核心原则是:平台没有任何按钮可以手动修改或删除一条标注。一旦标注被用户的评分系统认定为”有帮助”,它就会展示,直到系统层面判定它不再有帮助。
这意味着平台放弃了”真相裁决者”的身份,转而成为一个”让用户发现真相”的工具。这个设计从根本上解决了”谁来监督平台本身”的问题。
洞察5:最有效的干预不是删除,而是给用户更多信息
数据显示,当一条推文被添加Community Notes后,用户转发这条推文的概率下降50%到60%,同时发帖作者删除推文的概率上升80%。这说明”告诉用户更多背景信息”比”直接删除内容”更有效。用户不是被强迫接受真相,而是被给予了判断的工具。
四、精彩金句
“如果你的标注能被平时观点对立的人都认为有帮助,那它大概率是客观准确的。” ——Keith Coleman,解释Community Notes的评分机制如何识别高质量标注
“我们不希望有任何按钮可以让平台手动修改一条标注的状态。如果标注有问题,那是系统设计的问题,不是人工干预能解决的。” ——Keith Coleman,强调”平台不能成为真相裁决者”的原则
“你不需要成为一个知名人物才能影响公共讨论和信息流动。任何人写的一条标注,都可能让白宫重新发布声明。” ——Keith Coleman,描述Community Notes如何让普通人拥有真正的信息影响力
“我以前信任很多事情,现在我会更审慎地看待我读到的内容。这是一种好的’次级效应’。” ——J Bter,描述使用Community Notes后对自己思维方式的影响
“当你被强迫用极少的工程师来完成工作时,删除代码比写代码更重要。” ——Keith Coleman,描述极简团队如何迫使团队保持系统的精简和可维护性
五、实战案例
案例:白宫删除推文
在2022年Community Notes刚刚在美国全面上线后不久,一条标注出现在白宫的推文下方。写这条标注的用户可能只有十几个粉丝,几乎从未在任何公共讨论中产生影响。但这条标注指出白宫声明中的一个事实错误。几小时后,白宫删除了原推文并重新发布了更正后的版本。
这就是Community Notes的力量:它让任何普通人都能在最高级别的信息战场上产生影响,而不需要任何机构授权。
案例:2023年以色列-哈马斯冲突
2023年10月,新一轮冲突爆发,随之而来的是铺天盖地的虚假信息——假照片、伪造视频、游戏画面被当作真实战场画面传播。在冲突爆发的前三天,Community Notes社区写出了500多条标注,覆盖各种类型的虚假内容。其中一条标注解释了一个看起来非常真实的战斗视频实际上是来自游戏《武装行动3》(Arma 3)的画面。
关键在于速度:当时标注从发布到展示的中位时间只有5小时,而传统事实核查通常需要两到四天。这得益于几个月前刚刚上线的一个速度优化功能。
案例:狗还是猫
一位用户发布了一张图片,配文说:“这个巴勒斯坦男孩把面包分给了一只狗。“但图片实际上是一只猫。有用户写了一条简单的标注:“这是一只猫。“并附上了维基百科的链接。
这显然不是需要”专业事实核查”的案例,但它完美地展示了Community Notes的本质——这是普通人在用最简单的方式纠正最明显的信息错误,是用户社区在自我维护信息环境。
六、行动建议
建议1:如果你在运营一个内容平台,考虑引入”众包式上下文补充”机制
为什么做:传统的”平台审核内容”模式已经暴露出信任问题和规模瓶颈。Community Notes证明用户可以成为优质信息的共同维护者。
如何开始:从一个可控的试点开始,选择一个特定的争议性话题或内容类型,邀请愿意参与的资深用户为内容添加背景说明。然后设计评分机制,让不同观点的用户都能参与验证。
能得到什么:更高的用户信任度、更快的响应速度、更低的运营成本。
建议2:如果你在考虑如何提升团队效率,尝试”热气球团队”模式
为什么做:Community Notes团队用5个人完成了改变互联网信息生态的产品,而传统互联网公司可能需要几十甚至上百人。
如何开始:找到一个真正有影响力的目标,让团队成员自愿选择加入(而非被指派)。确保有一位能快速做决策的高级负责人。取消所有重型项目管理流程,用简单的文档替代。
能得到什么:更快的迭代速度、更强的团队主人翁意识、更高的产出质量。
建议3:如果你是产品经理,尝试”假设验证式产品开发”而非”完美规划式开发”
为什么做:Community Notes从一开始就通过低保真原型、众包测试、小规模试点来验证假设,每一步都有数据支撑决策。这避免了投入大量资源后才发现方向错误的风险。
如何开始:先用Figma做出最简单的原型,让目标用户人群测试并反馈。然后做小规模的真实环境测试(比如1000人)。只有当数据证明假设成立后,才考虑扩大规模。
能得到什么:更低的产品失败风险、更快的学习速度、更好的资源分配。
建议4:如果你在设计AI辅助内容审核系统,考虑让AI”辅助人类”而非”替代人类”
为什么做:Community Notes团队正在探索用AI生成标注的多个变体,然后用模拟评分系统来预测人类会如何评价这些变体,最终由人类决定使用哪个版本。这保持了人类判断的核心地位,同时放大了效率。
如何开始:不要让AI直接发布内容或标注。让AI做”加速和扩展”的工作——比如生成初稿、匹配相似内容、检测明显错误——然后交由人类评分和决策。
能得到什么:更高的内容质量、更低的人工成本、更可控的AI错误风险。
建议5:无论你在做什么产品,定期问自己:“我们的用户真的需要我们来做这个决定吗?”
为什么做:Community Notes成功的核心前提是”平台不需要成为真相的裁决者”。这个原则可以应用到几乎任何产品领域——你的用户是否有能力自己做出判断?他们是否更信任自己做决定?
如何开始:在每一次产品决策中,问这个问题。如果答案是肯定的,考虑如何把决定权还给用户,而不是承担更多控制和责任。
能得到什么:更高的用户信任、更少的平台责任风险、更强的产品生命力。
七、我的总结
Community Notes是一个极其罕见的案例——一个从”听起来不可能”的想法,变成了真正改变互联网信息生态的产品。它的成功不是因为它用了更先进的技术,而是因为它对”什么是真相”这个古老问题提出了新的解答:不是由权威来裁决,而是通过让观点不同的人都参与到验证过程中来发现真相。
这个产品背后最值得学习的,不是算法本身,而是一套产品哲学:透明优先而非控制优先;让用户帮助用户,而非让平台替用户做决定;用机制而非人工来维护质量;用真实数据来验证每一个假设,而非用规划来预测未来。
而团队运作方式同样值得深思:他们用极少的人、极高的自主权、极简的流程,做出了比任何大型团队更大的影响。这提醒我们,在追求”更大规模”之前,先问自己:“我们真的需要那么多人吗?”
最后,Keith在采访结束时说的一句话值得我们所有人记住:“这个世界看起来很分裂,但实际上,人们能够同意的事情比我们以为的多得多。” Community Notes正是这个乐观主义论断的最大实践证据。
📺 播客信息
- 发布时间:2025-02-27
- 时长:1小时47分钟58秒
- 播放量:9075 次观看
- 原版视频:『YouTube』