文章总结: 智谱GLM-5是744B参数的开源大模型,采用DSA稀疏注意力技术,在推理、编码及智能体任务上达开源顶尖水平,性能逼近闭源前沿模型。支持长上下文、多格式文档生成及国产芯片部署。文章详述其技术规格、性能基准、部署指南及应用场景,展现了其在软件工程与数据分析等领域的强大能力与开源价值。 综合评分: 85 文章分类: 产品介绍,AI安全,安全开发
【人工智能】智谱 GLM-5 工具介绍
原创
利刃信安 利刃信安
利刃信安
2026年2月25日 14:00 北京
智谱 GLM-5 工具介绍
1. 产品概述
GLM-5 是智谱 AI 推出的最新大型语言模型,针对复杂系统工程和长周期智能体任务进行了优化。它通过大规模参数扩展和先进的训练技术,实现了在推理、编码和智能体任务上的最佳性能,是当前开源模型中的佼佼者。
2. 技术规格
2.1 模型规模
- • 参数数量:744B 参数(40B 活跃)
- • 训练数据:28.5T tokens
- • 上下文长度:支持长上下文处理
- • 技术创新:集成 DeepSeek Sparse Attention (DSA),显著降低部署成本
2.2 训练技术
- • 稀疏注意力:DeepSeek Sparse Attention (DSA) 技术
- • 异步 RL 基础设施:开发 slime 异步 RL 基础设施,提高训练吞吐量和效率
- • 预训练优化:优化预训练流程,提高模型性能
- • 后训练迭代:支持更精细的后训练迭代
3. 性能表现
GLM-5 在广泛的学术基准测试中表现优异,在推理、编码和智能体任务上达到世界开源模型中的最佳水平,缩小了与前沿模型的差距。
3.1 推理能力
| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | Humanity’s Last Exam | 30.5 | 24.8 | 25.1 | 31.5 | 28.4 | 37.2 | 35.4 | | Humanity’s Last Exam w/ Tools | 50.4 | 42.8 | 40.8 | 51.8 | 43.4* | 45.8* | 45.5* | | AIME 2026 I | 92.7 | 92.9 | 92.7 | 92.5 | 93.3 | 90.6 | – | | HMMT Nov. 2025 | 96.9 | 93.5 | 90.2 | 91.1 | 91.7 | 93.0 | 97.1 | | IMOAnswerBench | 82.5 | 82.0 | 78.3 | 81.8 | 78.5 | 83.3 | 86.3 | | GPQA-Diamond | 86.0 | 85.7 | 82.4 | 87.6 | 87.0 | 91.9 | 92.4 |
3.2 编码能力
| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | SWE-bench Verified | 77.8 | 73.8 | 73.1 | 76.8 | 80.9 | 76.2 | 80.0 | | SWE-bench Multilingual | 73.3 | 66.7 | 70.2 | 73.0 | 77.5 | 65.0 | 72.0 | | Terminal-Bench 2.0 Terminus-2 | 56.2 / 60.7† | 41.0 | 39.3 | 50.8 | 59.3 | 54.2 | 54.0 | | Terminal-Bench 2.0 Claude Code | 56.2 / 61.1† | 32.8 | 46.4 | – | 57.9 | – | – | | CyberGym | 43.2 | 23.5 | 17.3 | 41.3 | 50.6 | 39.9 | – |
3.3 智能体能力
| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | BrowseComp | 62.0 | 52.0 | 51.4 | 60.6 | 37.0 | 37.8 | – | | BrowseComp w/ Context Manage | 75.9 | 67.5 | 67.6 | 74.9 | 67.8 | 59.2 | 65.8 | | BrowseComp-Zh | 72.7 | 66.6 | 65.0 | 62.3 | 62.4 | 66.8 | 76.1 | | τ²-Bench | 89.7 | 87.4 | 85.3 | 80.2 | 91.6 | 90.7 | 85.5 | | MCP-Atlas Public Set | 67.8 | 52.0 | 62.2 | 63.8 | 65.2 | 66.6 | 68.0 | | Tool-Decathlon | 39.2 | 23.8 | 35.2 | 27.8 | 43.5 | 36.4 | 46.3 | | Vending Bench 2 | $4,432.12 | $2,376.82 | $1,034.00 | $1,198.46 | $4,967.06 | $5,478.16 | $3,591.33 |
*: 指完整集合的分数 †: 修复了一些模糊指令的 Terminal-Bench 2.0 验证版本
4. 核心特性
4.1 复杂系统工程
- • 长上下文理解:支持处理长上下文,理解复杂系统
- • 多步骤推理:能够进行多步骤、多层次的推理
- • 代码理解与生成:深入理解代码结构和逻辑,生成高质量代码
- • 系统设计能力:能够设计和优化复杂系统架构
4.2 长周期智能体任务
- • 长期规划:在 Vending Bench 2 中表现优异,展示了强大的长期规划能力
- • 资源管理:有效管理资源,实现长期目标
- • 多任务协调:能够协调多个任务,实现复杂目标
- • 环境适应:能够适应环境变化,调整策略
4.3 文档生成能力
- • 多格式支持:直接生成 .docx、.pdf、.xlsx 文件
- • 专业文档:生成 PRD、教案、考试、电子表格、财务报告等
- • 端到端交付:从文本或源材料直接生成可用文档
- • 多轮协作:支持多轮协作,不断完善文档
4.4 多平台支持
- • 开源发布:在 Hugging Face 和 ModelScope 上开源
- • API 访问:通过 api.z.ai 和 BigModel.cn 提供 API 访问
- • 本地部署:支持本地部署,包括非 NVIDIA 芯片
- • 框架支持:支持 vLLM 和 SGLang 等推理框架
4.5 兼容性
- • Claude Code:与 Claude Code 兼容
- • OpenClaw:支持 OpenClaw 框架
- • 编码代理:支持多种编码代理,如 Claude Code、OpenCode、Kilo Code 等
- • Z.ai:在 Z.ai 平台上可用
5. 系统要求
5.1 硬件要求
- • GPU:推荐 NVIDIA A100 或更高性能的 GPU
- • 内存:至少 64GB RAM
- • 存储:足够的存储空间用于模型权重
- • CPU:多核 CPU
5.2 软件要求
- • 操作系统:Linux、Windows、macOS
- • Python:3.8 或更高版本
- • 推理框架:vLLM、SGLang 等
- • 依赖项:通过 pip 安装所需依赖
5.3 非 NVIDIA 芯片支持
- • 华为 Ascend
- • 摩尔线程
- • 寒武纪
- • 昆仑芯片
- • MetaX
- • 燧原
- • 海光
6. 安装与配置
6.1 本地部署
- 1. 下载模型权重:从 Hugging Face 或 ModelScope 下载模型权重
- 2. 安装依赖:
pip install vllm
# 或
pip install sglang
- 3. 配置推理服务:根据所选框架配置推理服务
- 4. 启动服务:启动推理服务
6.2 API 访问
- 1. 注册账号:在 api.z.ai 或 BigModel.cn 注册账号
- 2. 获取 API Key:获取 API Key
- 3. 调用 API:使用 API Key 调用 GLM-5 API
6.3 Z.ai 平台
- 1. 访问 Z.ai:打开 Z.ai 网站
- 2. 选择模型:在模型选项中选择 GLM-5
- 3. 开始使用:开始使用 GLM-5 进行对话或智能体任务
7. 使用方法
7.1 编码代理
- • GLM Coding Plan:订阅 GLM Coding Plan,在编码代理中使用 GLM-5
- • 配置方法:更新模型名称为 “GLM-5″(例如在 ~/.claude/settings.json 中)
- • 支持的编码代理:Claude Code、OpenCode、Kilo Code、Roo Code、Cline、Droid 等
7.2 OpenClaw 框架
- • 安装 OpenClaw:OpenClaw 包含在 GLM Coding Plan 中
- • 配置指南:按照官方指南配置 OpenClaw
- • 使用场景:将 GLM-5 转变为跨应用和设备操作的个人助手
7.3 Z.ai 平台
- • Chat 模式:即时响应,交互式聊天,轻量级交付
- • Agent 模式:多种工具,多样化技能,直接交付结果
- • 模型选择:手动将模型选项更改为 GLM-5
7.4 提示词工程
- • 具体任务描述:明确分析目标和期望结果
- • 专业术语:使用专业领域术语
- • 步骤指导:提供清晰的步骤建议
- • 输出格式:指定详细的输出格式要求
8. 应用场景
8.1 软件开发
- • 代码生成:生成高质量代码
- • 代码审查:审查代码质量和安全性
- • 架构设计:设计系统架构
- • 文档生成:生成技术文档和API文档
8.2 数据科学
- • 数据分析:分析复杂数据集
- • 模型训练:辅助模型训练和调优
- • 可视化:生成数据可视化
- • 报告生成:生成数据分析报告
8.3 研究与教育
- • 文献综述:生成文献综述
- • 论文写作:辅助论文写作
- • 课程设计:设计课程内容
- • 教学辅助:辅助教学过程
8.4 商业应用
- • 市场分析:分析市场趋势
- • 商业计划:制定商业计划
- • 财务分析:分析财务数据
- • 营销策略:制定营销策略
8.5 逆向工程
- • 代码分析:分析复杂代码
- • 算法识别:识别加密和压缩算法
- • 漏洞分析:分析软件漏洞
- • 恶意软件分析:分析恶意软件行为
9. 优势与价值
9.1 性能优势
- • 最佳开源模型:在推理、编码和智能体任务上达到世界开源模型最佳水平
- • 长周期任务:在 Vending Bench 2 中排名开源模型第一
- • 接近前沿模型:缩小了与 Claude Opus 4.5 等前沿模型的差距
- • 多语言支持:支持多种语言,包括中文
9.2 技术创新
- • 稀疏注意力:DeepSeek Sparse Attention (DSA) 技术,降低部署成本
- • 异步 RL:slime 异步 RL 基础设施,提高训练效率
- • 大规模参数:744B 参数,提供强大的表达能力
- • 丰富训练数据:28.5T tokens,涵盖广泛知识
9.3 应用价值
- • 提高效率:自动化处理复杂任务,提高工作效率
- • 降低门槛:使非专业人员也能完成复杂任务
- • 创新能力:提供新的解决方案和思路
- • 多领域适用:适用于软件开发、数据科学、研究教育等多个领域
9.4 开源贡献
- • MIT 许可证:模型权重以 MIT 许可证发布
- • 社区支持:支持社区贡献和改进
- • 开放生态:构建开放的 AI 生态系统
- • 知识共享:促进 AI 知识的共享和传播
10. 总结
GLM-5 作为智谱 AI 的最新大型语言模型,代表了 AI 技术的重要进步。它通过大规模参数扩展、先进的训练技术和创新的稀疏注意力机制,在推理、编码和智能体任务上达到了世界开源模型的最佳水平。
GLM-5 不仅在学术基准测试中表现优异,在实际应用场景中也展现出强大的能力。它能够处理复杂系统工程和长周期智能体任务,生成高质量的文档和代码,为各个领域的工作带来效率提升。
随着 GLM-5 的开源和广泛应用,它将为 AI 领域的发展做出重要贡献,推动 AI 技术在更多领域的应用和创新。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:利刃信安 利刃信安 利刃信安《【人工智能】智谱 GLM-5 工具介绍》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论