五角大楼计划允许人工智能公司在机密数据上训练模型

0 cnBeta.COM 2026-03-18 13:44:26

摘要：

据《麻省理工科技评论》报道，美国国防部正酝酿一项重大转变：为生成式人工智能公司搭建高度保密的训练环境，使其能够在机密军事情报数据上训练军用版本的大模型。这意味着，原本只是在涉密环境中“阅览”和“回答问题”的模型，未来可能直接以机密数据为训练素材，从而把敏感情报“写入”模型本身。

目前，一些生成式人工智能模型（例如 Anthropic 的 Claude）已经被部署在涉密环境中，用于回答问题和辅助分析，包括参与对伊朗目标的分析工作。不过，这些模型现阶段只是基于现有能力对机密信息进行处理，并不会把这些数据再用于训练更新模型本身。若允许在机密数据上训练，模型在执行特定军事任务时有望更加精准和高效，但同时也引入前所未有的安全风险。

一位不具名的美国国防官员表示，在机密数据上训练军方定制模型，预计将显著提升其在特定任务中的表现和可靠性。这一计划出现在美国军方对更强大 AI 模型需求日益高涨的背景下：五角大楼已经与 OpenAI 和马斯克旗下 xAI 达成协议，在涉密环境中运行其模型，并推行一项新的人工智能战略，旨在把美军打造为“以 AI 为先的作战力量”，以应对与伊朗日益升级的冲突。截至发稿，五角大楼尚未就这一训练计划作出正式评论。

据两名熟悉相关操作模式的人士介绍，上述训练将被安排在获得机密项目资质认证的数据中心中进行，在那里，某一版本的 AI 模型与机密数据在同一安全环境中配对运行。按照这位国防官员的说法，尽管数据所有权仍归美国国防部，但在极少数情况下，如相关人员具备相应的安全许可，AI 公司员工也可能获准接触这些机密数据。在真正触及机密数据之前，五角大楼计划先在非机密数据（例如商业卫星图像）上进行测试，以评估训练后的模型在准确性和有效性方面的实际改进。

美国军方长期以来一直使用较早一代的计算机视觉模型，对无人机与侦察机采集的图像与视频进行物体识别，并通过政府合同，委托企业在此类数据上训练算法。近年来，面向政府场景的专用大语言模型和聊天机器人版本也陆续出现，例如 Anthropic 推出的 Claude Gov，强调多语种能力和在安全环境中的部署。不过，这次国防官员的表态，是首次明确透露 OpenAI、xAI 等开发大型语言模型的公司，有可能直接在机密数据上训练政府定制版模型。

前Google与 OpenAI AI 政策负责人、现任战略与国际问题研究中心（CSIS）下属 Wadhwani AI 中心主任的 Aalok Mehta 指出，相比仅在涉密环境中“读取和回答”，真正用机密数据来训练模型，将带来新的风险。他认为最大的问题在于：模型训练所吸收的机密信息，有可能在日后被不同用户查询或调用时“重新浮现”。对于在不同保密等级、不同情报需求的多个军种或部门之间共用同一套模型，这一点尤其危险。

Mehta 举例称，假设某模型曾接触高度敏感的人力情报，例如一名秘密行动人员的身份，那么在另一支本不具备访问权限的军中部门使用该模型时，这些信息有可能意外“泄露”给他们。这不仅会对情报来源和前线人员造成生死攸关的风险，而且在技术上很难做到绝对防范，尤其是当同一模型被多个单位共用时。相比之下，他认为把机密信息“关”在军方内部，避免回流到开放互联网或 AI 公司端，相对更容易实现。

目前，美国政府已经建立起部分相关基础设施：例如安全公司 Palantir 已获得多个大型合同，为政府搭建可在不将信息回传给 AI 公司的前提下，对机密话题进行问答的安全系统。在这些系统中，官员可以就涉密内容向模型提问，而数据被限制在受控环境中流转。然而，把同样的安全架构用于训练，而不只是用于推理和问答，仍然是一项新的技术与管理挑战。

今年 1 月，国防部长 Pete Hegseth 发布备忘录，敦促加速在整个国防体系中引入更多 AI 能力，推动了五角大楼在该领域的竞速布局。生成式 AI 已经在实战中被使用，例如对潜在打击目标进行排序，并给出优先打击建议，同时也被用于撰写合同、整理报告等行政工作。在国防部门看来，许多原本由人类分析员完成的任务，未来都可能依赖更强的 AI 模型，但这也意味着必须向模型开放大量机密数据。

Mehta 称，军方可能希望 AI 学会一些高度依赖经验的微妙判断，例如像资深分析员那样在图像中识别极其细微的线索，或者把最新获得的情报与历史信息进行复杂关联。为此，情报部门庞杂而多语种的文本、音频、图像和视频数据，都可能成为训练素材来源。不过，他也强调，很难对外界说明到底哪些具体任务需要在机密数据上进行训练，因为国防部有强烈动机对自身具体能力保持保密，不希望其他国家精准了解美国在这一领域的技术边界。

在外界看来，五角大楼这一步既是对前线需求的回应，也是一场高风险的技术押注：一旦把机密情报深度嵌入大模型，军方将收获远超传统系统的自动化分析与决策辅助能力，但也必须面对模型“记忆”过多、意外泄露与访问边界模糊等新型安全隐患。当前，美国防务机构试图通过建立高度隔离的安全数据中心、严格的访问控制以及分层、定制化的模型部署方式，在“获得军事优势”和“控制安全风险”之间寻找一个尚未被实践充分检验的平衡点。

查看评论

今日最热

加载中...

最新资讯

今日最热