文章总结: 本文阐述AI智能体从概念到落地的演进,解析了基于大模型的L0至L5能力分级及数字与物理形态。文章指出智能体面临数据融合、算法黑箱及责任认定等瓶颈。针对技术风险与合规挑战,强调需构建包含风险识别的系统性治理框架,以保障安全可信发展。 综合评分: 84 文章分类: AI安全,政策法规,安全建设
从人类智能到智能体:Agent的发展与治理
原创
赛博研究院
赛博研究院
2026年1月2日 19:16 上海
AI Agent(智能体)已从技术概念加速走向产业落地。作为早在20世纪80-90年代就被提出的概念,智能体到近两年才迎来真正落地。
解构智能体的核心构成与发展逻辑,需聚焦其“智能内核”与“呈现形态”两大维度。
作为人工智能的一种发展形态,智能体的“智能”,本质是从人类智能到人工智能的模仿与超越过程。
美国心理学家加德纳曾提出多元智能理论,该理论系统界定了语言、空间、逻辑数理、肢体动觉、音乐、人际关系、自省、自然观察八大人类智能类型,不仅可以作为解析人类思维与能力的框架,也可以从中窥见人工智能、智能体的智能演进方向,比如推动衍生出了大语言模型、世界模型、逻辑推理AI、具身智能、音乐生成与音频处理类AI、情感识别/社交辅助类AI、环境识别与生态分析类AI等智能应用。
智能体“形态”的演变则离不开大模型突破、智能终端、具身智能等的发展。
根据是否搭载硬件,可分为智能体应用和AI具身智能体(即智能体+终端);根据其是否对物理空间产生影响,可分为数字型智能体(比如基于规则进行“输入-输出”且无需与环境互动的智能体)、物理型智能体(比如感知环境并通过自主决策影响实体行为的智能体,如自动驾驶智能体、工厂智能体等)。
AI Agent的演进路径与能力分级
现阶段,相较于大模型侧重“know-how”,智能体及多智能体协同更聚焦“do what”,通过思考、记忆、工具使用与任务执行的全链路能力,实现从技术能力到生产力价值的转化。
智能体的能力演进呈现清晰的迭代脉络:早期阶段以规则驱动为核心,仅具备基础的工具调用与固定动作执行能力。随着模仿学习与强化学习技术的成熟,智能体逐步集成推理与决策模块,具备场景化问题应对能力。
当前基于大语言模型的智能体,进一步构建记忆存储与反思优化机制,展现出自主学习和跨场景泛化能力。根据智能体成熟度,可将其划分为以下几个等级:
-
L0级:仅具备基础的感知与执行能力;
-
L1级:基于规则系统实现“感知-响应”闭环;
-
L2级:引入模仿学习与强化学习,具备环境推理与决策能力;
-
L3级:以大语言模型为核心,集成记忆与反思模块,实现初步自主任务执行;
-
L4级:具备跨场景自主学习与泛化能力;
-
L5级:融入人格化特征与多智能体协作机制,趋近通用人工智能。
智能体的应用场景与核心瓶颈
智能体的应用价值已得到广泛认可,政策导向为其规模化落地提供了明确方向。
国家层面,“人工智能+”行动提出“科学技术、产业发展、消费提质、民生福祉、治理能力及全球合作”六大AI融合应用领域,上海“模塑申城”则规划了五大重点领域(智能终端、科学智能、在线新经济、自动驾驶、具身智能)与六大行业(金融、制造、教育、医疗、文旅、城市治理)应用,均是扩大智能体应用的重要场景。
尽管应用前景广阔,但智能体在产业落地过程中仍面临多维度瓶颈,不同行业的核心痛点呈现差异化特征:比如多源异构数据的获取及融合成为工业智能体的发展阻碍,限制了其在复杂生产环境中的应用效能。算法黑箱问题以及金融监管下的谨慎应用态度,使得面向产品设计、授信贷款、投顾和风控的金融智能体在推广和创新方面面临挑战。极端环境数据的稀缺以及责任归责机制的不明确,成为自动驾驶智能体大规模商用的主要障碍等等。
总体来看,为推动智能体应用由单一智能体转向真正的多智能体协同,破解复杂任务瓶颈,需聚焦五个关键领域实现突破,包括认知与决策能力(智力上限)、多智能体协同机制(通信协议等)、高质量数据供给和开发利用、监管驱动的安全可信、部署成本和收益的平衡。
智能体的安全风险与治理框架
随着智能体加速渗透经济社会各领域,其引发的安全风险成为全球关注的核心议题,构建系统性治理体系迫在眉睫。
《AI Safety Index》等权威报告指出,治理问责缺失、系统性安全框架缺位、动态评估能力不足以及信息共享机制滞后等构成当前主要风险格局。
《AI Agent Adoption Report》的调研进一步证实了形势的严峻性:绝大多数(96%)受访者将智能体视为与日俱增的安全威胁;八成企业曾遭遇智能体越权操作;近四分之一(23%)的智能体存在凭证被诱骗泄露的漏洞。然而,仅有44%的企业制定了专项治理政策。
为系统应对风险挑战,需通过“治理目标确认-风险识别框架搭建-风险控制措施制定-持续改进”的路径构建治理体系。其中,风险识别是治理工作的核心前提,可从技术风险与合规风险两大维度构建智能体安全风险防控框架。
技术风险:模型算法作为构建智能体的核心,可能存在模型漂移/偏差、模型投毒、偏见/歧视、鲁棒性差等问题,影响智能体的稳定性与准确性;短时/长时数据作为智能体的记忆和知识库,面临数据质量和安全合规方面的风险,增加数据管理难度;智能体框架中的第三方组件可能面临后门攻击、供应链风险,影响整个智能体系统的安全性。此外,智能体部署应用过程中还存在滥用、数据泄露等隐患。
合规风险:需重点关注智能体应用服务所在国家或地区的监管要求,如欧盟《AI法案》对模型和AI系统的分级监管要求、《数字改革一揽子方案》对训练数据等最新调整,美国联邦及州对AI的差异化监管,以及国内《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《互联网信息服务管理办法》《人工智能生成合成标识办法》等文件。
综合来看,实现通用智能体、行业智能体的规模化落地和安全发展,最终依赖于构建一个技术可控、合规衔接、责任明晰的协同治理生态。
注:本文整理自杨“数”浦数字沙龙第十三期赛博研究院智库总监周雪静演讲内容。
赛博研究院简介
上海赛博网络安全产业创新研究院(简称赛博研究院),是上海市级民办非企业机构,成立至今,赛博研究院秉持战略、管理和技术的综合服务模式、致力于成为面向数字经济时代的战略科技智库、服务数据要素市场的专业咨询机构和汇聚数智安全技术的协同创新平台。
赛博研究院立足上海服务全国,是包括上海市委网信办、上海市通管局、上海市经信委、上海市数据局等单位的专业支撑机构,同时承担上海人工智能产业安全专家委员会秘书长单位、上海“浦江护航”数据安全工作委员会秘书长单位、上海数据安全协同创新实验室发起单位等重要功能,并组织“浦江护航”数据安全上海论坛、世界人工智能大会安全高端对话等一系列重要专业会议。
欢迎联络咨询:
邮件:[email protected];
电话:021-61432693。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:赛博研究院 赛博研究院《从人类智能到智能体:Agent的发展与治理》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论