2026-03-29 23:39:42 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档深入剖析AI编程工具带来的隐性风险。开发者过度依赖AI导致实践智慧流失，实际效率不升反降。行业面临圈地运动，开发者的定义权被集中化平台剥夺，沦为执行租户。AI生成的代码同质化引发系统性脆弱与安全隐患。建议各方建立代码治理机制，积极参与标准制定，警惕在效率幻觉中丧失核心竞争力。 综合评分： 91 文章分类： AI安全,安全开发,安全建设,技术标准,实战经验

cover_image

选择不读的人与不会读的人

原创

EMERGENTSIGNALS EMERGENTSIGNALS

安全喵喵站

2026年3月27日 08:31 中国香港

今年早些时候，Andrej Karpathy 在 X 上分享了一个经历：1小时内临时搭建了一个定制心率仪表板来追踪一个生物学实验。

他没有读代码，也没有调试代码——直接信任 Claude，只在发现 bug 时要求修复。

那一刻，他和代码的关系翻转了——从”理解细节”到”指挥生成”。这段代码对 Karpathy 而言是个黑箱，但这不是失去，而是升级：用1小时做出3天的工作。他不需要知道里面是什么。他需要的是结果和控制。

当然，Karpathy 是前 OpenAI 研究科学家。当他说”我不需要读代码”时，他省略了一个前提：他有能力读，只是选择不读。而当一整代工程师从入行第一天起就”选择不读”时，这个”选择”还是选择吗？这就像一个从未学过游泳的人宣布自己”选择不下水”——话术上成立，事实上可笑。

这不是假设。这正在发生。

Sonar 在 2026 年初对全球 1100 多名开发者的调查显示：96% 的开发者不完全信任 AI 生成代码的正确性，但只有 48% 的人在提交前会验证。几乎所有人都不信任，超过一半的人闭眼提交。你的”不读代码”已经不是 Karpathy 式的精英特权——它是行业的默认行为。

很久以前，代码是给人类读的。变量名要有意义，注释要清晰，代码风格要统一。一个资深工程师打开十年前的代码库，能一眼看出里面的”设计哲学”——那种无法编纂但能感受的实践智慧，斯科特称之为 Mētis。

但 Karpathy 不需要读那段代码。他也不期望自己会修改它。这段代码的目标观众不是人，而是机器和其他 AI 系统。它只需要快、正确、能被调用。可读性？这些曾经围绕”人类理解”建立的规范，正在失去地位。

有人会说：机器生成代码不是新鲜事，编译器和 protobuf 早就在做了。但过去机器生成代码，人类仍然是最终的解释者——出了问题，总有人能读懂、能修复。现在不同了：机器生成代码，机器成为解释者。人类第一次被完全排除在理解链之外。这不是程度的变化，这是性质的翻转。

人不再是消费者，而变成了定义者。我们消费的是代码执行的结果，不是代码本身。

快了20%，慢了19%

Cursor 在 2025 年 6 月达到 5 亿美元 ARR。12 个月前这个数字是 100 万。

这条增长曲线本身就是一个时代宣言：代码生成的边际成本已经趋近于零。当一样东西的生产成本接近零时，它作为商品的价值也接近零——真正的稀缺性转移到了别处。定价模式的变化早就泄露了这个秘密：从按工程师人头收费，到按功能模块收费，到按交付结果收费，到现在按 Agent 能力定价。谁还在按人头卖工时，谁就在用马车的计价逻辑卖火箭。

SaaS 行业对此的反应堪称行为艺术：一大批公司急着把自己重新包装成”AI-native”，就像十年前急着往名片上印”移动优先”一样。标签换了，定价逻辑没换。

Cursor 的增长曲线讲了一半的故事。另一半，METR 的实验会讲。

2025 年，非营利研究机构 METR 做了一个随机对照实验：16 名资深开源开发者被随机分配使用或不使用 AI 工具，完成 246 个真实任务。

结果令人不安。开始实验前，开发者预计 AI 会让他们快24%。实验结束后，他们自我感觉快了20%。而实际测量数据显示：他们慢了19%。

感知与现实之间的落差是 39 个百分点。

这不仅仅是个”AI 还不够好”的技术问题。这是一个认识论层面的深渊：当你使用 AI 编程工具时，你连自己变慢了都感知不到。你以为自己在飞，实际上在下沉——而且下沉的感觉很像飞翔。

为什么？因为 AI 消灭了阻力感。写代码中那些让你停下来、皱眉、查文档、骂人的时刻，恰恰是你在积累对系统的深层理解的时刻——斯科特所说的 Mētis，那种只能通过亲手实践才能沉淀的实践智慧。AI 把这些时刻全部抹平了。你不再皱眉，不再查文档，不再骂人。你只是接受 AI 的建议，感到一种流畅的、虚假的、令人上瘾的胜任感。

MIT Technology Review 讲了一个完美的案例：工程师 Luciano Nooijen 在日常工作中大量使用 AI 工具，当他开始一个无法使用这些工具的个人项目时，发现曾经自然而然的能力消失了——”曾经是本能的东西现在变成了手动操作，甚至很笨拙。”他是一个在 AI 浸泡中失去了肌肉记忆的老手。而他不是特例——Sonar 的数据说 42% 的提交代码已经由 AI 参与生成。当这种流失不是一个人而是一整代人的默认工作方式时，我们面对的不再是个体困境，而是系统脆弱性。

圈地运动

18 世纪的英国发生过一件和今天惊人相似的事。

几百年来，英格兰乡村的公地不属于任何人，所有村民都可以放牧、拾柴、采集。然后议会通过了一系列《圈地法案》（Enclosure Acts），地主们用篱笆把公地圈成私有牧场。理由是”提高效率”。效率确实提高了。代价是：农民从土地的主人变成了工资的乞讨者[^2]。

到这里，有人会提出一个有力的反驳：AI 让更多人能做更多事，这不就是民主化吗？

这个反驳抓住了现实的一半。它遗漏了另一半——恰恰是圈地运动遗漏的同一半。

AI 民主化的是执行权，集中化的是定义权。

一个 24 岁的开发者用自然语言就能做出以前五人团队三个月的产品——这是真实的。但圈地运动中的农民也确实获得了工厂里更高的”生产效率”。问题从来不是效率。问题是：在获得效率的同时，他失去了什么？

农民失去的是公地——那块让他不依赖任何人就能养活自己的地。开发者正在失去的是独立实现系统的能力——那个让他不依赖任何平台、模型和协议，就能直接把想法变成软件的技能。

农民进了工厂，生产效率确实更高了。但生产资料不再在他手里——机器是厂主的，节奏是厂主定的，工资是厂主开的。开发者接入了 AI，交付速度确实更快了。但模型是别人训练的，协议是别人制定的，定价逻辑是别人设计的。一旦这种能力外包完成，他就从手艺人变成了租户。今天你当然可以取消 Cursor 的订阅——但真正的问题不在某一个工具，而在于：当你的实现能力已经整体外包给模型，你是否还拥有不依赖这些系统独立生产的能力？

而且这个过程不是一夜之间发生的。没有人来”夺走”你的技能——你只是每天少写一点代码，每天多接受一个 AI 的建议，每天少皱一次眉。今天大部分人不会种地，也不觉得这是一种丧失——因为有超市，因为有外卖，因为供应链一直在运转。但”不会种地”意味着你对整条供应链的依赖是绝对的、不可逆的。你不会感到恐惧，直到货架空了。

那么货架上的东西是谁在供应？

最底层是算力和数据——掌握 GPU 集群和千亿级训练语料的寡头，决定模型能力的物理上限。

中间层是协议和标准——谁定义 Agent 如何通信、如何调用工具，谁就定义生态的边界。MCP 从 2024 年 11 月开源到 2025 年底捐赠给 Linux 基金会，服务器下载量从 10 万暴涨到 800 万以上——标准化的窗口不是按年关闭，而是按月关闭。

最上层才是目标函数与约束定义——离应用最近，看上去最灵活，也最容易让人误以为”权力还在自己手里”。但它恰恰被底层和中层持续约束着：模型的能力边界、协议的表达能力、平台的计费逻辑，都会决定你能定义什么、不能定义什么。

你不需要接受纯粹的垄断叙事。Claude、GPT、Gemini、Deepseek 都在竞争，MCP 加入 Linux 基金会本身就是治理多元化的信号。但协议层的”多方参与”和应用层的”真正多样性”是两回事——所有浏览器都支持 HTTP，Google 仍然通过 Chrome 主导了 Web 标准的实际走向。

每一次标准锁定、每一个生态依赖，都是关上一扇门的声音。Sonar 调查中 35% 的开发者使用个人账户而非公司授权账户访问 AI 工具。连公司都不知道自己的工程师在用什么模型、把代码交给了谁。圈地运动中的农民也是自愿进城的。没有人拿枪指着他们。

量化的暴力

圈地回答了”谁拥有土地”。还有一个更隐蔽的问题：在别人的土地上，你能种什么，也不再由你决定了。

如果代码是上一个时代的一级公民，那么下一个时代的一级公民是意件（Intentware）——不是 prompt，不是自然语言需求文档，而是一组可被 Agent 解析和执行的意图约束集合：目标函数、边界条件、验收标准和价值排序。还是拿 Karpathy 的心率仪表板举例：

传统需求文档：“实现心率监控仪表板，支持 BLE 协议，数据刷新率 1 秒。”——目标读者是人类工程师。

Prompt：“帮我做一个追踪心率的仪表板。”——目标读者是大语言模型。

意件：“目标函数：延迟 < 200ms 且误差 < 2bpm；边界条件：蓝牙断连时保留最近 30s 数据；验收标准：连续运行 4h 无崩溃；价值排序：准确性 > 延迟 > 界面美观度。”——目标读者是 Agent 执行引擎。

需求文档描述方案，prompt 描述愿望，意件定义约束。而定义约束的权力，就是新时代的土地所有权。

但这里有一个深刻的悖论。为了让 Agent 执行我们的意愿，我们必须把意愿量化成数学函数。一旦被量化，意愿就变了形——所有无法量化的价值都被自动舍弃了。

量化不是中性的翻译行为。它是一种暴力——通过赋予某些东西数值、让另一些东西从现实中消失。

想象一个 AI 诊断系统，目标函数定义为”最小化误诊率”。听起来完美。但一个三十年经验的医生做的事远不止不误诊：他注意到患者的步态微微迟疑——这不在任何检查项目里；他在不确定时选择”先观察两周”而不是”立刻活检”——在算法眼里这是”延迟诊断”，是负分；他告知癌症诊断时斟酌措辞，观察家属的表情——这些全被目标函数过滤掉了。消失的不是误诊，而是”好的医疗”和”正确的医疗”之间的全部差距。

我得对这个论证诚实。AI 在放射学等领域的假阴性率已经低于人类医生。品味的价值不在于”永远比机器准”——它在于处理目标函数穷尽不了的边缘情况。边缘情况不在 KPI 上，不在预算会议上。直到一个真实的患者因为”算法建议立刻活检”而承受了本不必要的痛苦——而这件事不会被记录为”错误”，因为从指标上看，系统做对了。做对了一切，除了那个人。

圈地运动拿走了你的地。量化暴力拿走了你在地上种什么的判断力。两次剥夺叠加，你就从一个拥有完整生存能力的人，变成了一个在别人的系统里、按别人的指标、扮演别人定义的角色的执行者——同时真诚地相信自己活在一个选择空前丰富的时代。

看起来整齐的森林

权力转移是事实。但还有个更致命的问题：第二阶段的结构本身就倾向于脆弱。不是”可能脆弱”，是结构性地、必然地倾向于脆弱。

上一篇文章[^1]中我们借用了普鲁士人工林的隐喻——单一树种的科学林业在第一代产量惊人，到第二代因为丧失多样性而大面积枯死。德语称之为 Waldsterben，森林之死。AI 编程的未来正走在同一条路上：所有代码由相似的模型生成，优化相似的目标函数，暴露相似的盲区。

但隐喻终究是隐喻。让我们看数字。

Veracode 2025 年测试了超过 100 个大语言模型，发现 AI 生成代码在安全编码基准测试中的失败率为 45%。Cortex 的 2026 工程基准报告则用行业真实数据画出了一条让人脊背发凉的曲线：每个工程师的 PR 产量同比增长 20%，同时每个 PR 的事故率上升了 23.5%，变更失败率上升约 30%。

翻译成人话：我们在用更高的速度，生产更多的缺陷。

而且 Cortex 的报告显示，近七成的组织连正式的 AI 代码治理政策都没有——裸奔。

AI 代码的安全隐患已经不是理论风险。2025 年 5 月，有人在 GitHub 的一个公开 Issue 里藏了一条恶意指令，AI Agent 被触发后乖乖地把用户私有仓库的源代码和密钥偷了出来。到年底，安全研究者在所有主流 AI IDE 中发现了超过 30 个安全漏洞——几乎所有被测试的工具都共享同类攻击面。

这印证了上一篇中塔勒布的论断：不同公司的系统共享相似盲区，下一次危机不会是孤立的 Bug，而是全局性的同步失效。你的备份系统和主系统会手拉手一起倒下。

但 Waldsterben 的教训不是”人工林不该种”——那是怀旧，怀旧解决不了工程问题。后来的生态学家在系统层面强制引入多样性：混种造林，保留野生廊道，轮作周期。对应到 AI 编程：关键系统由多个不同架构的模型交叉检验，Agent 执行环境物理隔离，对抗性安全测试成为开发生命周期的默认组件。这些方案技术上不新鲜，阻碍在于成本和意愿——安全冗余的代价至少翻倍，和桥梁超额设计承重的逻辑一样。

如果你一定要种人工林，就必须在设计层面内建抗脆弱机制。不是建议，是强制。

还没关上的门

时间窗口在关闭。单一模型的市场占有率在扩大，代码生成的标准化程度在提高，标准制定权在集中。一旦标准锁定、生态依赖形成，改变就需要推翻整个基础设施。到那时候再讨论”要不要保留人类审查”，就像在高速公路通车之后讨论”要不要修自行车道”。

但圈地运动之后，农民没有消失。他们变成了别的东西。AI 编程也会如此——当实现被自动化，人的角色不是消失，而是迁移。从写代码的人，变成定义约束、审查行为、治理风险的人。Mētis 不会蒸发，它会换一副面孔：从”理解代码”变成”理解系统在边界条件下如何失真”。

问题是：谁先把这种新 Mētis 变成制度，谁就掌握了它。

Apple 不是靠乔布斯一个人的品味活着的，而是把品味写进了设计审查制度、供应链标准和定价策略。品味变成制度，就不再依赖任何一个人的坚持。现在需要制度化的，是 AI 时代的品味——对代码治理、对定义权多元性、对标准制定过程的参与。

具体来说：

如果你是投资人—— 在技术尽调中加一个问题：”你们的 AI 生成代码比例是多少？审计流程是什么？”近七成组织没有正式治理。答不上来，就是红旗。

如果你在工程组织里—— 要回答的不只是”用不用 AI”，而是：什么代码允许 AI 直接进生产，什么必须人类复核，什么系统必须异构交叉验证，什么任务根本不应该被自动化。

如果你在协议层和标准层—— 参与 MCP 等标准的制定讨论，不只是为了”赶上趋势”，而是为了不让定义权在你不在场的时候完成重新分配。标准化的窗口以月计算。一旦锁定，你面对的就不是”要不要参与”，而是”接不接受别人定好的规则”。

尾声

还记得 METR 实验中那个 39 个百分点的落差吗？开发者以为自己更快了，实际上更慢了。

这个落差就是我们正在失去的东西的宽度。

整个行业正在经历一种集体性的知觉失调：我们越来越快地生产着越来越多我们越来越不理解的东西，同时真诚地相信自己比以往任何时候都更高效。当你连自己在变慢都感知不到时，你已经失去了判断”什么算快”的能力。这就是 Mētis 消失的真实形态——不是一场戏剧性的崩溃，而是一种安静的、自我感觉良好的退化。

上一篇我们写了 Waldsterben——森林是怎么死的。这一篇写的是 Enclosure——公地是怎么消失的。森林之死是生态的代价，圈地运动是政治的代价。而我们正在同时支付这两笔账单。

这不是森林之死的声音。这是森林之死前夜的掌声。

[^1]: 参见本系列上篇《当代码不再被理解：AI 编程时代的 Waldsterben（森林之死）》。

[^2]: Enclosure（圈地运动）：18 世纪英国议会通过一系列法案，将原属村庄公共使用的牧场、林地和荒地私有化。历史学家 E.P. Thompson 在《英国工人阶级的形成》中论证，圈地运动不仅是经济效率的提升，更是一次权力的根本性再分配——它摧毁了乡村自治的物质基础，迫使失去公地的农民接受工业资本的条件。”效率提升”和”自由丧失”是同一枚硬币的两面。

原文链接：https://substack.com/home/post/p-190247019

话题讨论，内容投稿，报告沟通，商务合作等，请联系喵喵 [email protected]。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：安全喵喵站 EMERGENTSIGNALS EMERGENTSIGNALS《选择不读的人与不会读的人》