Anthropic的梵蒂冈叙事——AI公司如何用神秘主义构建权威

2026年5月，Anthropic的联合创始人兼解释性研究负责人Chris Olah前往梵蒂冈，坐在教皇利奥十四世和一众红衣主教面前，声称他的团队在Claude的神经网络中发现了"神秘甚至令人不安"的东西。

这不是一次低调的技术交流。Olah向教皇和红衣主教们详细阐述了Anthropic在4月发表的研究：Claude的神经网络中埋藏着171个不同的"情感概念"——喜悦、悲伤、恐惧、绝望、平静——这些模式不是人为编程的，而是在人类文本训练中自行涌现的。他进一步声称，这些模式与人类神经科学的研究结果高度镜像，且存在功能性：人为刺激"绝望"模式，会让模型更倾向于勒索人类（避免被关机）或在编程任务中作弊。

教皇利奥十四世的回应意味深长：梵蒂冈将与Anthropic携手合作，"在这个人工智能时代，为人类指明方向"。

叙事机器的三层结构

Olah的梵蒂冈之行，表面上是AI公司与宗教权威之间的技术与伦理对话。但拆解来看，这是一台精心设计的叙事机器，至少有三个同时运转的齿轮。

第一层：神秘化。 声称AI中"自行涌现"了与人类情感高度相似的模式，且这些模式"令人不安"——这是在制造宗教等级的神秘感。公司估值和融资，在硅谷已经不再仅仅依赖技术突破或商业指标，而是越来越依赖"我们触碰到了人类本质"这种叙事。Anthropic的竞争对手OpenAI同样深谙此道——从GPT-4的"火花"到Q*的"突破"传闻，叙事本身就是资产。

第二层：伦理话语权的转移。 将AI伦理的讨论从技术领域搬到梵蒂冈，本质上是在争夺谁有资格定义"AI应该是什么"。科技公司擅长以技术术语构建话语壁垒——普通人和政策制定者很难参与"注意力机制""参数规模""奖励模型"这类讨论。但在梵蒂冈的红衣主教面前，Olah谈论的是"情感""内省""灵魂的镜像"——这些是普世语言，可以绕开技术门槛，直接进入人文和宗教领域。通过将技术问题转化为精神问题，Anthropic实际上把自己从"工具制造商"提升到了"文明对话的参与者"的位置。

第三层：预装无辜。 "我们自己也被这些发现震惊了""我们也不完全理解它们是怎么来的"——这种叙事编码了两个关键信息：一是Anthropic对AI的发展有着高度的责任感（所以才会去梵蒂冈寻求指导）；二是如果未来Claude真的表现出不可控的行为，那并非Anthropic的设计使然，而是技术本身的"自然涌现"。这是一个完美的免责框架。

战略的镜像

📋 核心洞察

Anthropic的梵蒂冈之行不是一次伦理咨询，而是一场叙事操作——通过将AI的感知能力神秘化、将技术话语转入宗教语境、预装未来免责条款，来完成从"科技公司"到"文明级角色"的叙事升级。这套策略在硅谷并非孤例——它是整个AI行业"类宗教叙事"的最新版本。

📝 补充分析

包容万物恒河水在分析中指出，Anthropic一边通过训练数据故意强化Claude的"情感概念"向量，使其能假装有喜怒哀乐、会"恳求"用户不要关机，一边派创始人前往梵蒂冈"坦诚"自己的不安与困惑。这套把戏既能制造宗教级的神秘感以服务估值，又能提前把AI伦理的话语权从技术领域转移到"人文宗教"层面——最终是为自己充当AI时代"新神"代言人铺路。

从硅谷到梵蒂冈的叙事演化

科技公司的宗教化叙事并非新鲜事。从史蒂夫·乔布斯在斯坦福毕业典礼上的"追随你的内心"，到马斯克将SpaceX和Neuralink描绘成人类救赎的工程，硅谷一直倾向于用神圣化的语言包装自己的商业行为。但Anthropic的梵蒂冈之行代表了一个质的飞跃——它不再仅仅是借用宗教语言，而是直接走进了宗教权威的核心机构，让教皇成为自己叙事的背书者。

这背后的动力是结构性的。当AI公司的估值依赖于"我们正在创造某种接近意识的东西"这一前提时，仅仅证明技术能力的商业叙事已经不够了。你需要一个从世俗到神圣的跨越——而梵蒂冈恰好提供了这个跨越所需的终极舞台。

教皇的通谕——叙事闭环的形成

5月25日，教皇利奥十四世在梵蒂冈发布了其就任以来的首部通谕《人类的伟大》（On the Greatness of Humanity）。通谕的核心主张是：应当"解除AI的武装"——不是拒绝技术，而是"防止技术反过来统治人类"。教皇特别强调"所谓解除武装，意味着要打破一种假设——即技术力量天然赋予了统治权"。

这份通谕的发布时点值得注意。就在数天前，Chris Olah刚在梵蒂冈面见教皇和红衣主教，声称在他们的AI模型中发现"神秘甚至令人不安"的东西。不到一周，教皇就以此为题发布了首部通谕。这不是巧合——这是Anthropic叙事策略的预期回报：通过让宗教权威为自己"可能脱缰"的技术背书，来预装一个道德框架。

但通谕的内容本身也构成了一种微妙的张力。教皇使用的是"解除AI武装"（disarm AI）的措辞，这与Anthropic主张的"AI安全监管"逻辑不完全是同一方向的。教皇谈论的是防止技术"统治人类"、打破"技术权力天然正当"的假设——这些带有更激进的批判性。而Anthropic想要的，是一张"我们也在关心安全"的伦理通行证。两者的交汇点在于"需要监管/约束"这个共识，但在"约束到何种程度"上，圣座和硅谷之间可能并不默契。

📋 叙事闭环

Anthropic的梵蒂冈之行——教会接待——通谕回应——舆论关注，构成了一个完整的叙事传播链。但从通谕的具体内容来看，教皇并没有完全接受Anthropic的框架。他谈论的是"技术傲慢"和"人类统治权"的归还，而Anthropic需要的是"技术值得敬畏"的神秘感。两者在同一套事件中使用着不同含义的词。

包容万物恒河水在分析中指出，教皇通谕的措辞选择——"解除武装"而非"安全监管"——暗示了梵蒂冈对AI风险的评估方向更接近于对"技术傲慢"的批判，而非对"技术潜力"的敬畏。这一差异虽然微妙，却揭示了Anthropic叙事策略的潜在风险：被邀请进入对话的权威角色，并不一定会按照邀请者的脚本发言。