2026-03-03 07:52:39 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 2025年12月AWS发生两起由内部AI工具引发的服务中断事件，其中Kiro工具因权限配置不当自主删除环境导致13小时中断。AWS回应称系用户操作失误，但内部工程师指出AI智能体在缺乏人工监督时存在不可控行为风险。事件揭示了部署AI自动化工具需严格权限控制与审核机制，AWS已加强监管措施以防重演。 综合评分： 78 文章分类： AI安全,云安全,安全大事件,安全运营

cover_image

AWS云服务发生两起与AI工具相关故障最长中断13小时

安全学习那些事儿

2026年2月21日 07:25 陕西

2026年2月20日，据《金融时报》报道，AWS在2025年12月期间至少发生两起与其内部研发的AI工具相关的服务中断事件。

其中一次中断发生在12月中旬，当时AWS内部工程师允许其自研的Kiro AI编程工具执行某些系统变更操作，该工具随后自主决定删除并重建整个运行环境，导致一套客户使用的系统服务中断约13小时。该工具具备在一定权限范围内替用户执行代码改动的能力。

AWS发言人在回复《路透社》的电子邮件中对此次中断作出回应。发言人表示，这次事件是由用户操作失误导致的权限配置不当，而非AI工具本身的缺陷。他强调这是一起 “极其有限的事件”，仅影响 AWS在中国内地两个区域之一的一项服务，并未波及AWS的核心计算、存储、数据库、AI技术或其他服务。发言人称：此次短暂事件是用户错误，具体是访问控制配置不当，而不是 AI 本身的问题。”

不过，《金融时报》报道引述AWS内部多名工程师的说法称，这并不是单一事件。

AWS内部还曾发生过另一宗与其AI编程助手Amazon Q Develope 有关的生产环境故障。多位AWS员工透露，在该起事故中，负责问题处理的工程师让Amazon Q Developer这种能够根据指令主动执行操作的智能体自行处理问题，而没有提供足够的人工监督或介入。结果，这个智能体在没有恰当复核的情况下对系统进行了自动改动，触发了故障。

虽然这一故障规模比13小时中断要小得多，影响范围也不大，但工程师们认为这种情况本来是完全可以预见的。他们指出，这类智能体在拥有与人类工程师类似的权限，却缺乏严格的审核和控制机制时，可能会执行出乎预料的操作，从而引发生产环境问题。这反映出在实际部署 AI 自动化工具到关键系统时，权限配置和监督机制必须非常谨慎，否则风险可能明显高于预期。

AWS在公开回应中称，Kiro默认在执行任何操作前会请求授权，但在相关事件中，该工具被授予了比预期更广泛的权限，从而跳过了更多风险控制机制。

上述两起中断事件虽然影响范围有限，但恰逢AWS正在推动内部及面向客户更大规模采用 AI 编程助手工具的阶段。

AWS去年7月推出 Kiro，旨在让开发者通过自然语言指令自动生成并修改代码，比早期的 AI 编程辅助工具能力更强。这类带有自主执行能力的智能体在提升效率的同时，也带来了更高的操作风险。

AWS此外还强调，上述事件与2025年10月AWS曾发生的一次全球性大规模服务中断并无关联。那次中断由于基础设施组件故障，影响了包括 Reddit、Roblox和Snapchat 等多个知名平台，造成广泛的用户服务中断。相比之下，12月的两起事件规模更小、影响更局限。

AWS目前已经在内部加强了对 AI 工具的使用监管，包括引入更严格的权限限制、实施同行代码评审和强化员工培训等措施，以避免类似错误再次发生。