AWS云服务发生两起与AI工具相关故障 最长中断13小时

admin 2026-03-03 07:52:39 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 2025年12月AWS发生两起由内部AI工具引发的服务中断事件,其中Kiro工具因权限配置不当自主删除环境导致13小时中断。AWS回应称系用户操作失误,但内部工程师指出AI智能体在缺乏人工监督时存在不可控行为风险。事件揭示了部署AI自动化工具需严格权限控制与审核机制,AWS已加强监管措施以防重演。 综合评分: 78 文章分类: AI安全,云安全,安全大事件,安全运营


cover_image

AWS云服务发生两起与AI工具相关故障 最长中断13小时

安全学习那些事儿

2026年2月21日 07:25 陕西

2026年2月20日,据《金融时报》报道,AWS在2025年12月期间至少发生两起与其内部研发的AI工具相关的服务中断事件。

其中一次中断发生在12月中旬,当时AWS内部工程师允许其自研的Kiro AI编程工具执行某些系统变更操作,该工具随后自主决定删除并重建整个运行环境,导致一套客户使用的系统服务中断约13小时。该工具具备在一定权限范围内替用户执行代码改动的能力。

AWS发言人在回复《路透社》的电子邮件中对此次中断作出回应。发言人表示,这次事件是由用户操作失误导致的权限配置不当,而非AI工具本身的缺陷。他强调这是一起 “极其有限的事件”,仅影响 AWS在中国内地两个区域之一的一项服务,并未波及AWS的核心计算、存储、数据库、AI技术或其他服务。发言人称:此次短暂事件是用户错误,具体是访问控制配置不当,而不是 AI 本身的问题。”

不过,《金融时报》报道引述AWS内部多名工程师的说法称,这并不是单一事件。

AWS内部还曾发生过另一宗与其AI编程助手Amazon Q Develope 有关的生产环境故障。多位AWS员工透露,在该起事故中,负责问题处理的工程师让Amazon Q Developer这种能够根据指令主动执行操作的智能体自行处理问题,而没有提供足够的人工监督或介入。结果,这个智能体在没有恰当复核的情况下对系统进行了自动改动,触发了故障。

虽然这一故障规模比13小时中断要小得多,影响范围也不大,但工程师们认为这种情况本来是完全可以预见的。他们指出,这类智能体在拥有与人类工程师类似的权限,却缺乏严格的审核和控制机制时,可能会执行出乎预料的操作,从而引发生产环境问题。这反映出在实际部署 AI 自动化工具到关键系统时,权限配置和监督机制必须非常谨慎,否则风险可能明显高于预期。

AWS在公开回应中称,Kiro默认在执行任何操作前会请求授权,但在相关事件中,该工具被授予了比预期更广泛的权限,从而跳过了更多风险控制机制。

上述两起中断事件虽然影响范围有限,但恰逢AWS正在推动内部及面向客户更大规模采用 AI 编程助手工具的阶段。

AWS去年7月推出 Kiro,旨在让开发者通过自然语言指令自动生成并修改代码,比早期的 AI 编程辅助工具能力更强。这类带有自主执行能力的智能体在提升效率的同时,也带来了更高的操作风险。

AWS此外还强调,上述事件与2025年10月AWS曾发生的一次全球性大规模服务中断并无关联。那次中断由于基础设施组件故障,影响了包括 Reddit、Roblox和Snapchat 等多个知名平台,造成广泛的用户服务中断。相比之下,12月的两起事件规模更小、影响更局限。

AWS目前已经在内部加强了对 AI 工具的使用监管,包括引入更严格的权限限制、实施同行代码评审和强化员工培训等措施,以避免类似错误再次发生。

相关阅读

我国公共数据资源供给规模不断扩大 登记总量已超25万项

安哥拉知名记者iPhone遭Intellexa“掠食者”间谍软件入侵

法国银行账户国家数据库遭非法访问


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:安全学习那些事儿 《AWS云服务发生两起与AI工具相关故障 最长中断13小时》

评论:0   参与:  0