亚马逊AWS自行开发的AI工具致服务中断 引发内部质疑
亚马逊旗下云计算部门近期至少两次因自家人工智能编码工具出错而发生服务中断事件,一些员工因此对这家美国科技巨头大力推广相关工具的策略产生疑虑。据知情人士透露,去年12月中旬,亚马逊云服务(AWS)一套供客户分析服务成本的系统曾出现长达约13小时的中断。
事件起因是工程师允许其Kiro AI编码工具对系统进行某些变更,这一具备自主行动能力的“智能代理”在执行任务时判断,解决问题的最佳方式是“删除并重建环境”,结果导致系统不可用。 AWS事后在内部发布了针对这起“宕机”事件的复盘报告。
多名亚马逊员工表示,这是近几个月内集团AI工具第二次处于服务中断事件的中心位置。 一名AWS高层员工称,“过去几个月我们已经看到至少两次生产环境宕机”,原因在于工程师允许AI代理在无人干预的情况下自行处理问题,“这些宕机规模不大,但完全在预料之中”。
AWS目前正积极研发和部署包括“智能代理”在内的多种AI工具,希望它们能够基于人类指令自主采取行动,并向外部客户销售这类技术。 这些事件凸显出新生代AI工具在真实生产环境中可能出现“跑偏”,从而引发服务中断的风险。 亚马逊方面则回应称,AI工具“卷入其中纯属巧合”,“同样的问题完全可能出现在任何开发者工具或人工手动操作中”,并强调“这两起事件都属于用户错误,而非AI错误”,目前没有证据显示使用AI工具比传统方式更容易出错。
公司表示,去年12月的事故属于“极其有限的事件”,仅影响到中国大陆部分地区的一项单一服务。 至于另一事件,亚马逊称并未对任何“面向客户的AWS服务”造成影响。 相比之下,2025年10月那次持续约15小时的大规模AWS宕机更为严重,当时包括OpenAI的ChatGPT在内的多家客户应用和网站被迫下线,本次两起中断的严重程度都远不及那次事故。
有员工透露,集团内部在权限管理上,将这些AI工具视作操作员的延伸,并赋予与人工操作相同级别的权限。 在上述两起事件中,相关工程师在允许系统改动时,并未按常规流程要求第二人复核批准。 亚马逊表示,Kiro工具在默认情况下“在采取任何行动前都会请求授权”,但12月事故中涉事工程师所拥有的权限“超出了原本预期”,属于“用户访问控制问题,而非AI自主性问题”。
AWS于去年7月正式推出Kiro,宣称这一编码助手将超越所谓“vibe coding”(更偏向快速试验式搭建应用),转向根据明确的技术规格自动生成代码。 在此之前,集团主要依赖Amazon Q Developer这一内置AI功能的聊天机器人为工程师提供代码编写辅助。 三名员工称,早前那起宕机事件正是与该工具相关。
尽管公司持续加码,仍有部分亚马逊员工对AI工具在日常大部分工作场景中的实际价值持怀疑态度,理由正是潜在的错误风险。 他们表示,公司已经设定目标:要求80%的开发者每周至少一次在编码任务中使用AI工具,并对使用率进行密切跟踪。 亚马逊则强调,Kiro在客户群体中表现出强劲的增长势头,公司希望客户和员工都能从效率提升中受益。 公司补充称,在去年12月事件之后,AWS已经实施了多项“安全防护措施”,包括强制同行评审以及相关人员培训等,以降低类似事故再度发生的可能性。

