保障先进人工智能的4种治理方法

admin 2026-01-27 14:31:59 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 兰德报告分析先进AI治理,提出四种路径:政府强制安全标准、联邦授权、行业认证及自律合作。报告对比各方案在安全级别、合规可能性与行业负担间的权衡,建议决策者依据风险评估选择策略,以在强化安全与维持创新间取得平衡。 综合评分: 85 文章分类: 政策法规,AI安全,解决方案


cover_image

保障先进人工智能的4种治理方法

原创

所长007 所长007

蓝军开源情报

2026年1月27日 11:51 湖南

关注▲蓝军开源情报▲和10万+情报研究员,一起成长

【导读】

兰德公司2026年1月23日发布的报告《保障先进人工智能的4种治理方法》针对先进人工智能系统带来的社会风险及监管博弈进行了深度研判。

当前美国政府在推动私营企业加强安全措施与保持创新竞争力之间面临两难博弈,单纯依靠企业自愿承诺难以应对日益复杂的安全态势,而过度监管又可能抑制产业活力。

本研究基于对核能、化工及医疗等七个高风险行业治理经验的复盘,提炼出驱动合规的四大基础要素,并据此构建了四种针对先进人工智能的治理路径。这些路径涵盖了从政府立法强制执行标准、联邦采购授权限制、行业主导认证体系到公私合作自律监管等不同维度的政策选项。

报告详细剖析了各方案的领导机制、安全要求、合规验证及执法手段,并量化评估了其在安全性、合规可能性及行业负担之间的权衡关系,为决策者在强化国家安全防线与维持技术霸权之间寻求战略平衡提供了理论支撑与行动框架。

报告《保障先进人工智能的4种治理方法》共计6000字。加入蓝军开源情报知识星球会员,免费下载本文原文及完整译文。如需要购买其它精译报告、自研报告及情报数据库,请加微信:lanjunqingbao2081。

关键词:人工智能,治理方法,人工智能安全,AI合规性

这是蓝军开源情报的第 502期分享

编译 l 所长007

来源 l 蓝军开源情报(ID:Lanjunqingbao) 转载请联系授权(微信号:Lanjunqingbao2081)

人们日益担忧先进人工智能系统带来的社会风险,由此引发了关于美国政府是否以及如何推动私营企业开发商采取更严格的安全措施的辩论。尽管一些公司已自愿承诺保护其系统,但竞争压力和做法的不一致引发了人们对自我监管有效性的质疑。与此同时,政府干预也存在风险:过于严格的安全要求可能会限制创新,阻碍小型企业的发展,并损害美国的竞争力。

为了帮助美国政府和人工智能行业应对这些挑战,兰德公司的研究人员提出了四种不同的治理方法,以加强先进人工智能系统开发商的安全实践:

1.政府强制执行针对高风险模型开发商的人工智能安全标准

2.政府主导的人工智能开发者授权计划,以联邦使用人工智能必须符合安全规定为条件。

3.行业主导的人工智能安全认证将促进通用标准的采用。

4.自律监管与政府和行业在安全实践方面加强合作相结合

通过提出各种切实可行的方案,这项工作使决策者能够更好地权衡利弊,并在加强安全和保持创新之间找到合适的平衡点。

一、什么因素驱动更强大的安全性和合规性?

为了给人工智能行业带来经验教训,研究人员考察了核能、化工、医疗保健等七个高风险行业的安全治理方法。

在这些行业中,他们发现联邦机构和行业联盟都建立了合规机制,以促进整个行业采用安全标准。这些治理模式通过激励和惩罚相结合的方式,力求改变企业的成本效益考量,并促使企业加大对安全防护措施的投资。

在这些方法中,兰德公司的研究人员确定了四个对实现合规性和促进安全至关重要的基础要素:

领导力和机构能力是组织要素,它们提供设计和实施框架所需的权威、资源和专业知识。

安全要求确立了实体应如何保护系统、数据和物理资产的预期,并为问责制和监督奠定了基础。

合规性验证包括用于评估实体是否符合既定安全要求的流程,例如审计和报告要求。

执法机制是推动合规的工具,包括对不合规行为进行处罚和取消福利。

由于多种原因,包括受保护资产的性质以及受监管实体的数量和多样性不同,各监管制度对每个要素的处理方法各不相同。如果某些要素发展不足或执行不力,则会导致合规滞后和安全漏洞持续存在。

该分析还确定了指导合规机制设计和实施的两项原则:比例原则,即根据实体的风险水平和运营能力调整要求;以及利益相关者参与和透明度。这两项原则共同作用,最大限度地减少了不必要的负担,增强了相关方对合规机制合法性的认知,并提高了合规的可能性。

二、三种保障先进人工智能安全的合规机制示例

在已确定的四种政策方案中,有三种涉及建立合规机制,旨在强制或激励前沿人工智能产业采用通用安全标准:(1) 政府强制执行的安全标准,(2) 政府主导的开发者授权,以及 (3) 行业主导的认证。以下概述了每种方案如何解决成功机制的四个基本要素。

| | | | | — | — | — | | 01.政府强制执行的人工智能安全标准(SAFE-AI) | 02.联邦政府用途人工智能开发者授权(SecureAI 授权) | 03.行业主导的人工智能安全认证(FASSO) | | 强制要求高风险通用人工智能开发商采用安全标准,以防止盗窃、滥用和泄露。 | 授权开发人员为联邦政府使用,以确保符合安全设计原则。 | 提供自愿但具有约束力的认证计划,以促进人工智能开发人员之间通用的安全标准。 | | 授权和牵头实体 | | | | 国会新立法;美国商务部下属新成立的人工智能安全研究所 | 管理和预算办公室 (OMB) 的政策指导,已纳入联邦采购法规;美国总务管理局 (GSA) 内部的联邦风险和授权管理计划 (FedRAMP)-AI 扩展 | 基于共识的多方利益相关者治理,设有标准委员会、争议解决委员会和合规委员会;行业联盟(如已成立) | | 安全要求 | | | | 混合型(规范性、结果导向型、风险导向型),以美国国家标准与技术研究院 (NIST) 标准(如已制定)为依据;包含国家层面的保护目标 | 与授权级别(高、中、低)相匹配的混合型(规范性、风险导向型)标准;根据数据敏感性和影响进行调整 | 以行业最佳实践为基础,并由社区制定的安全控制措施;可能具有规范性,但实施选项灵活。 | | 合规性验证 | | | | 机制 审计和现场检查 事件报告和季度风险报告 独立政府渗透测试 举报人报告和保护 | 机制 事件报告要求 定期漏洞扫描 第三方评估机构定期进行安全审计 | 机制 事件报告 要求 定期漏洞扫描 第三方评估机构定期进行安全审计 | | 流程步骤 模型注册和自我评估 按风险等级划分 提交安全计划 审核、批准和检查 持续的审计和报告 | 流程步骤 确定影响程度 提交安全计划 接受第三方评估 获得授权 监控和更新 | 流程步骤 模型注册和自我评估 接受第三方审计 委员会审查 认证信息已列入公共登记册。 持续监测 | | 执法机制 | | | | 纠正措施计划 分级处罚 运营暂停 公开披露违规行为 | 纠正措施计划 暂停或撤销授权 | 纠正措施计划 暂停或取消认证 公开披露违规行为 |

  1. 政府强制执行的人工智能安全标准

保障先进前沿环境——人工智能(SAFE-AI)

该机制要求高风险通用模型的开发者采用安全标准,以降低模型被盗、滥用和遭到破坏的风险。该机制由国会新立法授权,并由商务部下属新成立的人工智能安全与保障研究所(AISSI,前身为人工智能标准与创新中心)负责监督。该机制采用分级、基于风险的结构,其中最严格的安全措施仅适用于高风险模型开发者,以防范国家级威胁。合规性通过审计、渗透测试和事件报告来确保,而问责制则通过一系列适度的执法行动来落实,这些行动旨在提供补救机会。

领导层和治理机构。国会授权AISSI制定和执行安全要求。AISSI通过正式的规则制定程序提出规则,该程序由总统任命的理事会指导,并参考公众和行业意见。人工智能安全与合规总监负责监督专门从事人工智能安全、网络防御和监管监督的技术人员。

安全要求。SAFE-AI 制定了规范性和结果导向型安全要求,并根据训练计算确定的模型风险设定了分级义务。所有受监管的实验室都必须遵守基线控制措施,而高风险模型开发者则必须满足更严格的要求,以抵御老练的国家级对手。

合规性验证。实验室通过事件报告、审计、检查、独立政府红队演练和举报人保护等方式证明其合规性。功能最强大的模型会受到最严格的监管。

执法机制。SAFE-AI 通过纠正措施计划、逐步升级的民事处罚、暂停运营和公开披露等方式来处理违规行为,处罚力度与违规行为的严重程度成正比。

  1. 联邦政府用途的人工智能开发者授权

SecureAI 授权

这项联邦计划授权人工智能开发商在政府系统中使用人工智能,并要求其遵守“安全设计”原则。[2]SecureAI 由根据修订后的联邦政策扩充的 FedRAMP 项目办公室运营,它建立了基于风险的授权层级,对处理敏感政府数据或为重大决策提供信息的模型施加更严格的要求。[3]合规性通过第三方评估机构、持续监控和纠正措施计划来强制执行,包括撤销不合规实验室的授权。该计划有助于确保部署在敏感政府环境(例如处理机密情报或为军事决策提供信息的模型)中的模型能够抵御篡改和隐蔽行为。

领导力与治理。SecureAI项目扩展了 OMB 的政策,将人工智能模型开发商的“安全设计”要求纳入联邦采购规则。[4]新成立的 FedRAMP 办公室负责监督授权和合规性,由各机构高级首席信息官组成的指导委员会制定高层政策,咨询专家委员会则负责提出改进控制措施的建议。认证团队负责管理技术评估并对第三方审计机构进行认证。

安全要求。该机制创建了基于风险的授权层级;处理敏感数据或为重大决策提供信息的模型须遵守最严格的安全要求。

合规性验证。获得授权的开发人员需接受影响级别评估和第三方审计,并提交安全计划以证明其合规性。FedRAMP 项目经理会授予有时限的授权,但前提是持续监控、漏洞扫描、事件报告、定期审计以及在重大模型更新后进行重新评估。

执行机制。获授权的开发商必须在整改计划中记录缺陷,并及时实施补救措施。项目经理将审查整改措施,并对不合规行为采取相应措施,包括暂停联邦使用权和撤销授权。

  1. 行业主导的人工智能安全认证

前沿人工智能安全标准组织(FASSO)

FASSO是一个新成立的行业联盟,它建立了一套认证体系,旨在强制参与的前沿人工智能开发商遵守共同的安全标准,以缓解可能阻碍安全投资的竞争压力。FASSO采用多方利益相关者治理结构,下设标准、认证和合规三个专门委员会。参与FASSO完全自愿,但具有约束力。认证结果将公开展示,不合规的开发商必须进行整改,否则将面临包括取消认证在内的处罚。

领导层和治理机制。多方利益相关者治理机制包括领先的人工智能实验室、安全专家和不参与投票的政府联络员。技术委员会负责制定安全标准、监督合规性、解决争议并认证审计人员。中央理事会协调这些职能并监督问责行动。虽然参与是自愿的,但参与的开发者必须遵守安全义务。

安全要求。安全标准的制定融合了技术专长和联盟成员的意见,以确保其既严谨又可行。控制措施在必要时具有强制性,同时保持灵活性和多样化的实施选项,以适应不同的系统和不断演变的威胁。

合规性验证。开发者必须注册模型、进行自我评估,并接受第三方审计,审计结果由FASSO合规委员会审核。认证状态公开透明,并持续进行监控、重新评估和事件报告。争议将通过公正的调解解决。

执法机制。不合规的开发商必须在严密监控下整改缺陷。持续不合规可能导致暂停资质、取消认证,以及违规行为被公开。

  1. 自我监管和加强政府与行业的合作

第四种政策选择强调政府与行业自愿合作,以推进特定领域人工智能开发人员的安全实践,而不是强制实施正式的合规制度。

研究人员发现,政府参与可以在以下几个领域提供独特的价值:制定人工智能安全标准、促进情报和信息共享,以及扩大开发人员参与政府渗透测试和人员审查计划的渠道。

制定人工智能安全标准。美国国家标准与技术研究院应在业界参与下,制定前沿人工智能系统的技术安全标准,以弥补现有框架的不足。凭借其协商一致、共识驱动的方法,美国国家标准与技术研究院可以与业界紧密合作,将安全最佳实践和技术专长融入其中。此举有助于建立保护前沿人工智能系统的规范,确保整个行业实施的一致性,并为监管或自愿合规工作奠定基础。

规范政府与前沿人工智能实验室之间的情报和信息共享。为帮助前沿人工智能实验室主动加强防御,联邦政府可以扩大在人工智能特定威胁、漏洞和安全最佳实践方面的信息共享。关键举措包括:确定实验室的优先信息需求;指定一名联邦政府联络员负责该行业;加强对人工智能实验室所面临威胁的情报收集;以及简化机密情报共享流程。反过来,人工智能实验室也应分享其事件和调查中获得的经验,使政府能够核对自身情报,并形成新的威胁和漏洞洞察。

支持红队评估和渗透测试。联邦政府应提供渗透测试服务——类似于国家安全局、网络安全和基础设施安全局以及各军种已向私营部门提供的服务——以模拟现实世界中敌对势力试图利用系统漏洞并测试防御措施的行为。尽管许多实验室会与内部团队或第三方团队合作开展红队演练,但联邦团队可以通过提供独特的能力来增强这些服务,例如获取机密威胁情报、模拟国家级攻击者的能力以及在复杂网络中开展长期攻击活动的经验。

加强人工智能实验室人员审查。政府可以通过支持对敏感岗位员工进行人员审查和适任性评估,帮助人工智能实验室减少内部威胁。可行的方案包括:将国家安全许可流程扩展至特定职位;开展有针对性的背景调查但不颁发许可;或将申请人与联邦安全数据库进行比对,以识别潜在风险。这些方法将充分利用政府的独特权限和信息,同时赋予实验室更强大的工具来防范内部威胁。

三、哪个方案最佳?

尽管多种治理方法都能促进前沿人工智能实验室的安全,但每种方法都涉及安全级别、合规可能性以及对行业造成的负担等方面的权衡。决策者可能会根据自身优先事项选择不同的方案。这些权衡总结在表1中。

表1.不同治理方式的权衡比较

| | | | | | — | — | — | — | | | 安全级别 | 合规可能性 | 最大限度减轻行业负担 | | 01.政府强制执行的人工智能安全标准(SAFE-AI) | 高的 设定最高安全标准,拥有强大的监管权力;抵御国家级威胁 | 高的 涵盖所有高风险模型开发者;强有力的法律权威和执行力推动其普及应用。 | 低的 严格的强制性规定和广泛的覆盖范围可能会给行业带来沉重的负担和成本。 | | 02.AI开发者授权(联邦政府用途)(SecureAI授权) | 中等的 对高影响力政府用途有严格的标准,但选择性加入的设计限制了覆盖范围。 | 中等的 自愿参与;仅限政府承包商;联邦政府企业主要激励措施 | 中等的 分级义务和选择性参与给企业带来不同的负担。 | | 03.行业主导的人工智能安全认证(FASSO) | 中低 为了鼓励采用,标准可能会放宽;行业参与可以纳入技术专长。 | 中低 自愿参与;由于不认证带来的声誉风险,参与激励较弱。 | 高的 开发人员塑造和调整需求 | | 04.自律和公私合作 | 低的 仅在特定区域和与政府有业务往来的公司中推进安全。 | 低的 自愿;依赖市场力量;行业内采用程度不一 | 高的 企业可自由选择经营方式。 |

1.SAFE-AI:拥有最严格的安全标准和执行机制,但也提出了更高的要求。该方案具有最强的法律效力,由国会立法授权监管机构强制执行合规性。它涵盖所有符合高风险人工智能系统门槛的开发商,并设定了最高的安全标准,在抵御国家级威胁方面潜力最大。然而,由于它适用于所有高风险开发商,因此可能会给行业带来最沉重的成本和负担。

2.SecureAI:自愿参与虽然限制了覆盖范围,但也减轻了行业的负担。由于这种方法依赖于联邦采购条件来执行,因此仅适用于自愿选择与联邦政府开展业务的人工智能开发商,这可能限制了其覆盖范围。由于参与是自愿的,该机制在设定强有力的安全要求方面也可能受到限制;过于严格的要求可能会阻碍开发商的参与。然而,这种自愿参与的模式减轻了行业的总体负担,并降低了扼杀创新的风险。

3.FASSO:行业主导,负担适中,但安全性和参与激励机制较弱。在所有合规机制中,该方案的参与激励机制最弱,主要依靠行业自愿协议来推广共享的安全标准。因此,该机制可能难以确保合规的一致性,并且为了鼓励采用,可能会采取更为宽松的安全要求。然而,行业主导可以增强企业的归属感,从而比政府主导的模式更有效地促进合规。此外,行业的直接参与有助于确保安全要求反映实际运营的限制,并融入技术专长以提高有效性。

4.自律和公私合作:负担有限,但安全发展不均衡。由于这种方案没有建立正式的合规机制,而是依赖市场力量来激励人工智能开发者采用安全实践。因此,整个行业的安全方法和标准可能存在差异。然而,这种方法仍然可以在特定领域提升安全性,并且不会给开发者带来负担,从而避免扼杀创新。

选择合适的监管方式主要应基于以下几点:监管机制的基本原理、人工智能系统带来的风险程度,以及市场激励措施在多大程度上足以缓解这些风险。如果决策者认为前沿人工智能最终可能造成灾难性的社会危害,那么政府主导的合规机制和严格的安全标准或许是必要的。相反,如果对人工智能的风险持更为审慎的态度,则可能更适合采用负担较轻的监管框架,例如行业主导的倡议或自愿性的公私合作模式。

添加微信:lanjunqingbao2081

获取报告目录

👇👇

加入蓝军开源情报星球会员 免费下载2600+资料

👇👇

原价999元! 星球试运营期间199元! 试运营结束,恢复原价!

扫码了解、加入

👇👇


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:蓝军开源情报 所长007 所长007《保障先进人工智能的4种治理方法》

评论:0   参与:  0