五角大楼计划允许人工智能公司在机密数据上训练模型
据《麻省理工科技评论》报道,美国国防部正酝酿一项重大转变:为生成式人工智能公司搭建高度保密的训练环境,使其能够在机密军事情报数据上训练军用版本的大模型。 这意味着,原本只是在涉密环境中“阅览”和“回答问题”的模型,未来可能直接以机密数据为训练素材,从而把敏感情报“写入”模型本身。
目前,一些生成式人工智能模型(例如 Anthropic 的 Claude)已经被部署在涉密环境中,用于回答问题和辅助分析,包括参与对伊朗目标的分析工作。 不过,这些模型现阶段只是基于现有能力对机密信息进行处理,并不会把这些数据再用于训练更新模型本身。 若允许在机密数据上训练,模型在执行特定军事任务时有望更加精准和高效,但同时也引入前所未有的安全风险。
一位不具名的美国国防官员表示,在机密数据上训练军方定制模型,预计将显著提升其在特定任务中的表现和可靠性。 这一计划出现在美国军方对更强大 AI 模型需求日益高涨的背景下:五角大楼已经与 OpenAI 和马斯克旗下 xAI 达成协议,在涉密环境中运行其模型,并推行一项新的人工智能战略,旨在把美军打造为“以 AI 为先的作战力量”,以应对与伊朗日益升级的冲突。 截至发稿,五角大楼尚未就这一训练计划作出正式评论。
据两名熟悉相关操作模式的人士介绍,上述训练将被安排在获得机密项目资质认证的数据中心中进行,在那里,某一版本的 AI 模型与机密数据在同一安全环境中配对运行。 按照这位国防官员的说法,尽管数据所有权仍归美国国防部,但在极少数情况下,如相关人员具备相应的安全许可,AI 公司员工也可能获准接触这些机密数据。 在真正触及机密数据之前,五角大楼计划先在非机密数据(例如商业卫星图像)上进行测试,以评估训练后的模型在准确性和有效性方面的实际改进。
美国军方长期以来一直使用较早一代的计算机视觉模型,对无人机与侦察机采集的图像与视频进行物体识别,并通过政府合同,委托企业在此类数据上训练算法。 近年来,面向政府场景的专用大语言模型和聊天机器人版本也陆续出现,例如 Anthropic 推出的 Claude Gov,强调多语种能力和在安全环境中的部署。 不过,这次国防官员的表态,是首次明确透露 OpenAI、xAI 等开发大型语言模型的公司,有可能直接在机密数据上训练政府定制版模型。
前Google与 OpenAI AI 政策负责人、现任战略与国际问题研究中心(CSIS)下属 Wadhwani AI 中心主任的 Aalok Mehta 指出,相比仅在涉密环境中“读取和回答”,真正用机密数据来训练模型,将带来新的风险。 他认为最大的问题在于:模型训练所吸收的机密信息,有可能在日后被不同用户查询或调用时“重新浮现”。 对于在不同保密等级、不同情报需求的多个军种或部门之间共用同一套模型,这一点尤其危险。
Mehta 举例称,假设某模型曾接触高度敏感的人力情报,例如一名秘密行动人员的身份,那么在另一支本不具备访问权限的军中部门使用该模型时,这些信息有可能意外“泄露”给他们。 这不仅会对情报来源和前线人员造成生死攸关的风险,而且在技术上很难做到绝对防范,尤其是当同一模型被多个单位共用时。 相比之下,他认为把机密信息“关”在军方内部,避免回流到开放互联网或 AI 公司端,相对更容易实现。
目前,美国政府已经建立起部分相关基础设施:例如安全公司 Palantir 已获得多个大型合同,为政府搭建可在不将信息回传给 AI 公司的前提下,对机密话题进行问答的安全系统。 在这些系统中,官员可以就涉密内容向模型提问,而数据被限制在受控环境中流转。 然而,把同样的安全架构用于训练,而不只是用于推理和问答,仍然是一项新的技术与管理挑战。
今年 1 月,国防部长 Pete Hegseth 发布备忘录,敦促加速在整个国防体系中引入更多 AI 能力,推动了五角大楼在该领域的竞速布局。 生成式 AI 已经在实战中被使用,例如对潜在打击目标进行排序,并给出优先打击建议,同时也被用于撰写合同、整理报告等行政工作。 在国防部门看来,许多原本由人类分析员完成的任务,未来都可能依赖更强的 AI 模型,但这也意味着必须向模型开放大量机密数据。
Mehta 称,军方可能希望 AI 学会一些高度依赖经验的微妙判断,例如像资深分析员那样在图像中识别极其细微的线索,或者把最新获得的情报与历史信息进行复杂关联。 为此,情报部门庞杂而多语种的文本、音频、图像和视频数据,都可能成为训练素材来源。 不过,他也强调,很难对外界说明到底哪些具体任务需要在机密数据上进行训练,因为国防部有强烈动机对自身具体能力保持保密,不希望其他国家精准了解美国在这一领域的技术边界。
在外界看来,五角大楼这一步既是对前线需求的回应,也是一场高风险的技术押注:一旦把机密情报深度嵌入大模型,军方将收获远超传统系统的自动化分析与决策辅助能力,但也必须面对模型“记忆”过多、意外泄露与访问边界模糊等新型安全隐患。 当前,美国防务机构试图通过建立高度隔离的安全数据中心、严格的访问控制以及分层、定制化的模型部署方式,在“获得军事优势”和“控制安全风险”之间寻找一个尚未被实践充分检验的平衡点。

