文章总结: 文档深入剖析AI编程工具带来的隐性风险。开发者过度依赖AI导致实践智慧流失,实际效率不升反降。行业面临圈地运动,开发者的定义权被集中化平台剥夺,沦为执行租户。AI生成的代码同质化引发系统性脆弱与安全隐患。建议各方建立代码治理机制,积极参与标准制定,警惕在效率幻觉中丧失核心竞争力。 综合评分: 91 文章分类: AI安全,安全开发,安全建设,技术标准,实战经验
选择不读的人与不会读的人
原创
EMERGENTSIGNALS EMERGENTSIGNALS
安全喵喵站
2026年3月27日 08:31 中国香港
今年早些时候,Andrej Karpathy 在 X 上分享了一个经历:1小时内临时搭建了一个定制心率仪表板来追踪一个生物学实验。
他没有读代码,也没有调试代码——直接信任 Claude,只在发现 bug 时要求修复。
那一刻,他和代码的关系翻转了——从”理解细节”到”指挥生成”。这段代码对 Karpathy 而言是个黑箱,但这不是失去,而是升级:用1小时做出3天的工作。他不需要知道里面是什么。他需要的是结果和控制。
当然,Karpathy 是前 OpenAI 研究科学家。当他说”我不需要读代码”时,他省略了一个前提:他有能力读,只是选择不读。而当一整代工程师从入行第一天起就”选择不读”时,这个”选择”还是选择吗?这就像一个从未学过游泳的人宣布自己”选择不下水”——话术上成立,事实上可笑。
这不是假设。这正在发生。
Sonar 在 2026 年初对全球 1100 多名开发者的调查显示:96% 的开发者不完全信任 AI 生成代码的正确性,但只有 48% 的人在提交前会验证。几乎所有人都不信任,超过一半的人闭眼提交。你的”不读代码”已经不是 Karpathy 式的精英特权——它是行业的默认行为。
很久以前,代码是给人类读的。变量名要有意义,注释要清晰,代码风格要统一。一个资深工程师打开十年前的代码库,能一眼看出里面的”设计哲学”——那种无法编纂但能感受的实践智慧,斯科特称之为 Mētis。
但 Karpathy 不需要读那段代码。他也不期望自己会修改它。这段代码的目标观众不是人,而是机器和其他 AI 系统。它只需要快、正确、能被调用。可读性?这些曾经围绕”人类理解”建立的规范,正在失去地位。
有人会说:机器生成代码不是新鲜事,编译器和 protobuf 早就在做了。但过去机器生成代码,人类仍然是最终的解释者——出了问题,总有人能读懂、能修复。现在不同了:机器生成代码,机器成为解释者。人类第一次被完全排除在理解链之外。这不是程度的变化,这是性质的翻转。
人不再是消费者,而变成了定义者。我们消费的是代码执行的结果,不是代码本身。
快了20%,慢了19%
Cursor 在 2025 年 6 月达到 5 亿美元 ARR。12 个月前这个数字是 100 万。
这条增长曲线本身就是一个时代宣言:代码生成的边际成本已经趋近于零。当一样东西的生产成本接近零时,它作为商品的价值也接近零——真正的稀缺性转移到了别处。定价模式的变化早就泄露了这个秘密:从按工程师人头收费,到按功能模块收费,到按交付结果收费,到现在按 Agent 能力定价。谁还在按人头卖工时,谁就在用马车的计价逻辑卖火箭。
SaaS 行业对此的反应堪称行为艺术:一大批公司急着把自己重新包装成”AI-native”,就像十年前急着往名片上印”移动优先”一样。标签换了,定价逻辑没换。
Cursor 的增长曲线讲了一半的故事。另一半,METR 的实验会讲。
2025 年,非营利研究机构 METR 做了一个随机对照实验:16 名资深开源开发者被随机分配使用或不使用 AI 工具,完成 246 个真实任务。
结果令人不安。开始实验前,开发者预计 AI 会让他们快24%。实验结束后,他们自我感觉快了20%。而实际测量数据显示:他们慢了19%。
感知与现实之间的落差是 39 个百分点。
这不仅仅是个”AI 还不够好”的技术问题。这是一个认识论层面的深渊:当你使用 AI 编程工具时,你连自己变慢了都感知不到。你以为自己在飞,实际上在下沉——而且下沉的感觉很像飞翔。
为什么?因为 AI 消灭了阻力感。写代码中那些让你停下来、皱眉、查文档、骂人的时刻,恰恰是你在积累对系统的深层理解的时刻——斯科特所说的 Mētis,那种只能通过亲手实践才能沉淀的实践智慧。AI 把这些时刻全部抹平了。你不再皱眉,不再查文档,不再骂人。你只是接受 AI 的建议,感到一种流畅的、虚假的、令人上瘾的胜任感。
MIT Technology Review 讲了一个完美的案例:工程师 Luciano Nooijen 在日常工作中大量使用 AI 工具,当他开始一个无法使用这些工具的个人项目时,发现曾经自然而然的能力消失了——”曾经是本能的东西现在变成了手动操作,甚至很笨拙。”他是一个在 AI 浸泡中失去了肌肉记忆的老手。而他不是特例——Sonar 的数据说 42% 的提交代码已经由 AI 参与生成。当这种流失不是一个人而是一整代人的默认工作方式时,我们面对的不再是个体困境,而是系统脆弱性。
圈地运动
18 世纪的英国发生过一件和今天惊人相似的事。
几百年来,英格兰乡村的公地不属于任何人,所有村民都可以放牧、拾柴、采集。然后议会通过了一系列《圈地法案》(Enclosure Acts),地主们用篱笆把公地圈成私有牧场。理由是”提高效率”。效率确实提高了。代价是:农民从土地的主人变成了工资的乞讨者[^2]。
到这里,有人会提出一个有力的反驳:AI 让更多人能做更多事,这不就是民主化吗?
这个反驳抓住了现实的一半。它遗漏了另一半——恰恰是圈地运动遗漏的同一半。
AI 民主化的是执行权,集中化的是定义权。
一个 24 岁的开发者用自然语言就能做出以前五人团队三个月的产品——这是真实的。但圈地运动中的农民也确实获得了工厂里更高的”生产效率”。问题从来不是效率。问题是:在获得效率的同时,他失去了什么?
农民失去的是公地——那块让他不依赖任何人就能养活自己的地。开发者正在失去的是独立实现系统的能力——那个让他不依赖任何平台、模型和协议,就能直接把想法变成软件的技能。
农民进了工厂,生产效率确实更高了。但生产资料不再在他手里——机器是厂主的,节奏是厂主定的,工资是厂主开的。开发者接入了 AI,交付速度确实更快了。但模型是别人训练的,协议是别人制定的,定价逻辑是别人设计的。一旦这种能力外包完成,他就从手艺人变成了租户。今天你当然可以取消 Cursor 的订阅——但真正的问题不在某一个工具,而在于:当你的实现能力已经整体外包给模型,你是否还拥有不依赖这些系统独立生产的能力?
而且这个过程不是一夜之间发生的。没有人来”夺走”你的技能——你只是每天少写一点代码,每天多接受一个 AI 的建议,每天少皱一次眉。今天大部分人不会种地,也不觉得这是一种丧失——因为有超市,因为有外卖,因为供应链一直在运转。但”不会种地”意味着你对整条供应链的依赖是绝对的、不可逆的。你不会感到恐惧,直到货架空了。
那么货架上的东西是谁在供应?
最底层是算力和数据——掌握 GPU 集群和千亿级训练语料的寡头,决定模型能力的物理上限。
中间层是协议和标准——谁定义 Agent 如何通信、如何调用工具,谁就定义生态的边界。MCP 从 2024 年 11 月开源到 2025 年底捐赠给 Linux 基金会,服务器下载量从 10 万暴涨到 800 万以上——标准化的窗口不是按年关闭,而是按月关闭。
最上层才是目标函数与约束定义——离应用最近,看上去最灵活,也最容易让人误以为”权力还在自己手里”。但它恰恰被底层和中层持续约束着:模型的能力边界、协议的表达能力、平台的计费逻辑,都会决定你能定义什么、不能定义什么。
你不需要接受纯粹的垄断叙事。Claude、GPT、Gemini、Deepseek 都在竞争,MCP 加入 Linux 基金会本身就是治理多元化的信号。但协议层的”多方参与”和应用层的”真正多样性”是两回事——所有浏览器都支持 HTTP,Google 仍然通过 Chrome 主导了 Web 标准的实际走向。
每一次标准锁定、每一个生态依赖,都是关上一扇门的声音。Sonar 调查中 35% 的开发者使用个人账户而非公司授权账户访问 AI 工具。连公司都不知道自己的工程师在用什么模型、把代码交给了谁。圈地运动中的农民也是自愿进城的。没有人拿枪指着他们。
量化的暴力
圈地回答了”谁拥有土地”。还有一个更隐蔽的问题:在别人的土地上,你能种什么,也不再由你决定了。
如果代码是上一个时代的一级公民,那么下一个时代的一级公民是意件(Intentware)——不是 prompt,不是自然语言需求文档,而是一组可被 Agent 解析和执行的意图约束集合:目标函数、边界条件、验收标准和价值排序。还是拿 Karpathy 的心率仪表板举例:
传统需求文档:“实现心率监控仪表板,支持 BLE 协议,数据刷新率 1 秒。”——目标读者是人类工程师。
Prompt:“帮我做一个追踪心率的仪表板。”——目标读者是大语言模型。
意件:“目标函数:延迟 < 200ms 且误差 < 2bpm;边界条件:蓝牙断连时保留最近 30s 数据;验收标准:连续运行 4h 无崩溃;价值排序:准确性 > 延迟 > 界面美观度。”——目标读者是 Agent 执行引擎。
需求文档描述方案,prompt 描述愿望,意件定义约束。而定义约束的权力,就是新时代的土地所有权。
但这里有一个深刻的悖论。为了让 Agent 执行我们的意愿,我们必须把意愿量化成数学函数。一旦被量化,意愿就变了形——所有无法量化的价值都被自动舍弃了。
量化不是中性的翻译行为。它是一种暴力——通过赋予某些东西数值、让另一些东西从现实中消失。
想象一个 AI 诊断系统,目标函数定义为”最小化误诊率”。听起来完美。但一个三十年经验的医生做的事远不止不误诊:他注意到患者的步态微微迟疑——这不在任何检查项目里;他在不确定时选择”先观察两周”而不是”立刻活检”——在算法眼里这是”延迟诊断”,是负分;他告知癌症诊断时斟酌措辞,观察家属的表情——这些全被目标函数过滤掉了。消失的不是误诊,而是”好的医疗”和”正确的医疗”之间的全部差距。
我得对这个论证诚实。AI 在放射学等领域的假阴性率已经低于人类医生。品味的价值不在于”永远比机器准”——它在于处理目标函数穷尽不了的边缘情况。边缘情况不在 KPI 上,不在预算会议上。直到一个真实的患者因为”算法建议立刻活检”而承受了本不必要的痛苦——而这件事不会被记录为”错误”,因为从指标上看,系统做对了。做对了一切,除了那个人。
圈地运动拿走了你的地。量化暴力拿走了你在地上种什么的判断力。两次剥夺叠加,你就从一个拥有完整生存能力的人,变成了一个在别人的系统里、按别人的指标、扮演别人定义的角色的执行者——同时真诚地相信自己活在一个选择空前丰富的时代。
看起来整齐的森林
权力转移是事实。但还有个更致命的问题:第二阶段的结构本身就倾向于脆弱。不是”可能脆弱”,是结构性地、必然地倾向于脆弱。
上一篇文章[^1]中我们借用了普鲁士人工林的隐喻——单一树种的科学林业在第一代产量惊人,到第二代因为丧失多样性而大面积枯死。德语称之为 Waldsterben,森林之死。AI 编程的未来正走在同一条路上:所有代码由相似的模型生成,优化相似的目标函数,暴露相似的盲区。
但隐喻终究是隐喻。让我们看数字。
Veracode 2025 年测试了超过 100 个大语言模型,发现 AI 生成代码在安全编码基准测试中的失败率为 45%。Cortex 的 2026 工程基准报告则用行业真实数据画出了一条让人脊背发凉的曲线:每个工程师的 PR 产量同比增长 20%,同时每个 PR 的事故率上升了 23.5%,变更失败率上升约 30%。
翻译成人话:我们在用更高的速度,生产更多的缺陷。
而且 Cortex 的报告显示,近七成的组织连正式的 AI 代码治理政策都没有——裸奔。
AI 代码的安全隐患已经不是理论风险。2025 年 5 月,有人在 GitHub 的一个公开 Issue 里藏了一条恶意指令,AI Agent 被触发后乖乖地把用户私有仓库的源代码和密钥偷了出来。到年底,安全研究者在所有主流 AI IDE 中发现了超过 30 个安全漏洞——几乎所有被测试的工具都共享同类攻击面。
这印证了上一篇中塔勒布的论断:不同公司的系统共享相似盲区,下一次危机不会是孤立的 Bug,而是全局性的同步失效。你的备份系统和主系统会手拉手一起倒下。
但 Waldsterben 的教训不是”人工林不该种”——那是怀旧,怀旧解决不了工程问题。后来的生态学家在系统层面强制引入多样性:混种造林,保留野生廊道,轮作周期。对应到 AI 编程:关键系统由多个不同架构的模型交叉检验,Agent 执行环境物理隔离,对抗性安全测试成为开发生命周期的默认组件。这些方案技术上不新鲜,阻碍在于成本和意愿——安全冗余的代价至少翻倍,和桥梁超额设计承重的逻辑一样。
如果你一定要种人工林,就必须在设计层面内建抗脆弱机制。不是建议,是强制。
还没关上的门
时间窗口在关闭。单一模型的市场占有率在扩大,代码生成的标准化程度在提高,标准制定权在集中。一旦标准锁定、生态依赖形成,改变就需要推翻整个基础设施。到那时候再讨论”要不要保留人类审查”,就像在高速公路通车之后讨论”要不要修自行车道”。
但圈地运动之后,农民没有消失。他们变成了别的东西。AI 编程也会如此——当实现被自动化,人的角色不是消失,而是迁移。从写代码的人,变成定义约束、审查行为、治理风险的人。Mētis 不会蒸发,它会换一副面孔:从”理解代码”变成”理解系统在边界条件下如何失真”。
问题是:谁先把这种新 Mētis 变成制度,谁就掌握了它。
Apple 不是靠乔布斯一个人的品味活着的,而是把品味写进了设计审查制度、供应链标准和定价策略。品味变成制度,就不再依赖任何一个人的坚持。现在需要制度化的,是 AI 时代的品味——对代码治理、对定义权多元性、对标准制定过程的参与。
具体来说:
如果你是投资人—— 在技术尽调中加一个问题:”你们的 AI 生成代码比例是多少?审计流程是什么?”近七成组织没有正式治理。答不上来,就是红旗。
如果你在工程组织里—— 要回答的不只是”用不用 AI”,而是:什么代码允许 AI 直接进生产,什么必须人类复核,什么系统必须异构交叉验证,什么任务根本不应该被自动化。
如果你在协议层和标准层—— 参与 MCP 等标准的制定讨论,不只是为了”赶上趋势”,而是为了不让定义权在你不在场的时候完成重新分配。标准化的窗口以月计算。一旦锁定,你面对的就不是”要不要参与”,而是”接不接受别人定好的规则”。
尾声
还记得 METR 实验中那个 39 个百分点的落差吗?开发者以为自己更快了,实际上更慢了。
这个落差就是我们正在失去的东西的宽度。
整个行业正在经历一种集体性的知觉失调:我们越来越快地生产着越来越多我们越来越不理解的东西,同时真诚地相信自己比以往任何时候都更高效。当你连自己在变慢都感知不到时,你已经失去了判断”什么算快”的能力。这就是 Mētis 消失的真实形态——不是一场戏剧性的崩溃,而是一种安静的、自我感觉良好的退化。
上一篇我们写了 Waldsterben——森林是怎么死的。这一篇写的是 Enclosure——公地是怎么消失的。森林之死是生态的代价,圈地运动是政治的代价。而我们正在同时支付这两笔账单。
这不是森林之死的声音。这是森林之死前夜的掌声。
[^1]: 参见本系列上篇《当代码不再被理解:AI 编程时代的 Waldsterben(森林之死)》。
[^2]: Enclosure(圈地运动):18 世纪英国议会通过一系列法案,将原属村庄公共使用的牧场、林地和荒地私有化。历史学家 E.P. Thompson 在《英国工人阶级的形成》中论证,圈地运动不仅是经济效率的提升,更是一次权力的根本性再分配——它摧毁了乡村自治的物质基础,迫使失去公地的农民接受工业资本的条件。”效率提升”和”自由丧失”是同一枚硬币的两面。
原文链接:https://substack.com/home/post/p-190247019
话题讨论,内容投稿,报告沟通,商务合作等,请联系喵喵 [email protected]。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:安全喵喵站 EMERGENTSIGNALS EMERGENTSIGNALS《选择不读的人与不会读的人》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论