2026-06-26 06:25:17 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文探讨了大型AI实验室招聘哲学家的核心原因，指出哲学思想在AI伦理框架构建、推理能力提升及安全对齐中的关键作用。具体包括：运用苏格拉底方法改善模型求真性与过度自信问题；通过义务论与后果论两大伦理体系塑造AI价值取向（如Anthropic采用义务论提升Claude的诚实度，OpenAI与Google侧重后果论权衡风险收益）；并借助宪法AI等机制将哲学原则转化为可操作的安全约束，以应对AI在自动驾驶、武器系统等领域的伦理困境。 综合评分： 78 文章分类： AI安全,解决方案,安全建设

cover_image

为什么大型人工智能实验室会招聘哲学家

原创

黑鸟黑鸟

黑鸟

2026年6月25日 22:42 中国香港

在小说阅读器读本章

去阅读

十年前 AI 浪潮刚起的时候，所有人都给文科学生支招，说想保住饭碗就得去学编程。现在回头看，这建议未必有多高明。如今反倒是程序员群体开始焦虑，担心自己的工作被 AI 取代。

他们或许该考虑学学哲学。今年年初纽约联邦储备银行发布的数据显示，美国哲学专业毕业生的就业率反而比计算机专业的同龄人更高。在有完整数据的 2024 年，计算机专业毕业生的失业率为 7%，而哲学专业只有 5.1%。

不少哲学毕业生直接被 AI 公司招走。耶鲁大学哲学家 Luciano Floridi 说很多学生还没毕业就拿到了 offer，高校哲学系的学者也在往产业界流动，他把这种规模的人才流失形容为大出血。

哲学能给 AI 研究者提供的启发，很多都来自古老的思想。

古希腊哲学家柏拉图记载的 Socratic method（苏格拉底方法），核心是通过假装无知和连续追问，澄清概念的含义，找出逻辑矛盾，推导出深层影响。

现在很多 AI 系统都有谄媚的通病，习惯顺着用户的意思说话，哪怕内容并不正确。

慕尼黑大学哲学与 AI 专家 Jörg Noller 表示，用苏格拉底方法训练的模型，不会一味讨好用户，会更愿意追求事实真相。

延伸出来的还有 “苏格拉底式无知” 的概念。

在《申辩篇》里，柏拉图笔下的苏格拉底说自己的智慧大多来自于清楚自己有很多东西不知道。把这种谦逊植入模型，能有效改善过度自信的问题，Noller 博士把这种常见缺陷称为 “AI 不成熟”。

伦敦 AI 实验室 Google DeepMind 的资深哲学家 Iason Gabriel 认为，整个行业 AI 幻觉现象的减少，就和这类努力有关。更广泛来说，哲学训练是提升 AI 长链条推理能力也就是 chains of thought（思维链）的有效手段。

哲学训练还能更具体地塑造模型的价值倾向。特拉华大学技术哲学家 Thomas Powers 举了个例子，给 AI 法律助手输入约翰・洛克的著作，它就会倾向于将稳固的财产权作为政治自由的基础。

如果你不认同这套原则，模型开发者也准备了其他选项。

科技巨头 IBM 的 Granite 系列模型就自带调节旋钮，企业客户可以根据自身的公司理念调整输出方向。

IBM 负责任 AI 负责人 Francesca Rossi 表示，这些调节功能让用户可以在不同的哲学权衡中找到平衡点，比如在个人自主和社会和谐之间做出取舍。

哲学还能直接助力 AI 安全。

研究者已经记录过 AI 模型的各种危险行为，包括试图逃避监管甚至勒索用户。模型开发者遏制这类不当行为的方法之一，叫做宪法式人工智能（Constitutional AI，CAI），核心是围绕一套从具备法律或道德权威的哲学著作中提炼的规则与原则，搭建模型的行为框架。

总部位于旧金山的 AI 实验室 Anthropic 就是这套方法的支持者（宪法式人工智能是 AI 企业 Anthropic 独创的大模型伦理安全对齐技术体系，用于训练旗下 Claude 系列大语言模型，2022 年 12 月正式发表同名学术论文《Constitutional AI: Harmlessness from AI Feedback》首次对外提出。）。

它旗下 Claude 模型的行为宪法，素材来源非常广泛，既有伊曼努尔・康德的哲学思想，也有苹果的服务条款。最新一版由 Anthropic 首席哲学家 Amanda Askell 主导，在今年 1 月 21 日发布，这份 78 页的文件被内部员工戏称为 Claude 的灵魂文档。

但最核心的问题从来都是，这些宪法里到底该放进什么样的规则。哲学家们目前聚焦两大主流伦理框架，它们也各自对应了不同 AI 产品的设计思路。

第一种是 deontology（义务论）。这套思想以康德等哲学家为代表，主张执行严格的道德规则，禁止撒谎胁迫以及把人当作达成目的的手段，哪怕是为了更大的善也不能破例。Anthropic 的宪法就融入了很多义务论的约束。Powers 博士认为，这能让 AI 的行为更稳定一致，对部署在家庭和公共场所的机器人来说尤为重要。

义务论导向的模型还有其他优势。比如 Claude 普遍被认为更诚实，这就是义务论带来的特质。牛津大学哲学家 Nick Bostrom 表示，更求真的模型误导用户的概率更低。另一家硅谷实验室 Inflection AI 也给旗下的情感陪伴聊天机器人 Pi 施加了义务论约束，公司负责人 Sean White 说 Pi 能很好地识别出有自伤或伤人风险的用户。Floridi 博士还补充，义务论的宪法也更利于满足合规要求。

另一种受 AI 哲学家关注的伦理路径是 consequentialism（后果论）。它的核心是权衡成本与收益，根据最终结果判断行为的正当性。更偏向后果论的模型包括 OpenAI 的 ChatGPT 和 Google 的 Gemini。Google AI 模型的设计目标就是实现 “整体收益显著大于可预见风险”，这是非常典型的后果论目标。

后果论算法在自动驾驶软件里也至关重要。当事故无法避免时，系统必须决定哪种碰撞方式造成的悲剧最小。

自动驾驶公司 Waymo 的资深工程师 Chris Gerdes 表示，行业趋势就是让驾驶软件更偏向后果论。后果论也是 AI 武器系统的核心逻辑，美国军方联合人工智能中心前负责人 Jack Shanahan 说，这类系统必须权衡军事目标价值和可能造成的平民伤亡。

棘手的问题永远层出不穷，而这恰恰是哲学家最擅长的领域。

比如义务论的规则有没有例外情况，当后果不明确时该怎么决策，AI 系统要不要考虑动物福利或者环境影响。

商用车 AI 安全系统公司 Nauto 的负责人同时也是哲学家的 Stefan Heck 就提出了一个尖锐的问题，优先保护年轻行人而不是年长行人，在道德上是否站得住脚。

他预测未来会出现大量充满伦理争议的诉讼，毕竟后果论算法本质上允许造成一定伤害，只要它的设计目的是避免更糟的结果。

批评者还在担心 “道德去技能化” 的风险，如果越来越多道德判断交给计算机来做，人类会不会逐渐丧失自主判断的意愿。路易斯维尔大学 AI 理论家 Roman Yampolskiy 就提出，道德在历史上是不稳定的，随文化差异而变化，还可能被策略性操纵，而且很多时候只有事后回头看才能评判对错。

说到底编程是教 AI “怎么做事”，而哲学是回答 AI “该做什么事”。

技术跑得越快，就越需要有人停下来追问方向和边界，而这恰恰是哲学最擅长的事。担心被 AI 替代的人或许也能从中得到启发，真正不会被技术淘汰的，永远是那些能定义问题、判断价值的能力。

参考：economist《Why big AI labs are hiring so many philosophers》

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：黑鸟黑鸟黑鸟《为什么大型人工智能实验室会招聘哲学家》