2026-07-01 05:39:46 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： MITREATLAS团队设计了一个由4个Prompt和1套路由协议构成的多智能体知识库系统，通过Orchestrator、VectorStoreAgent、DatasetAgent和KumuGraphAgent的分层协作实现零幻觉问答。核心机制包括语义到精确的双层验证、三级置信度分级及严格的路由协议，确保所有回答均经过事实核查。该架构采用Langflow和ChromaDB等技术，无需业务代码即可处理837个安全实体，为AI安全知识库提供了可验证的工程范本。 综合评分： 88 文章分类： AI安全,安全建设,安全工具,解决方案,安全运营

cover_image

如何用 4 个 Prompt 构建一个零幻觉的 AI 安全知识库？

原创

APT-101 APT-101

APT-101

2026年6月30日 18:40 陕西

在小说阅读器读本章

去阅读

——拆解 MITRE ATLAS Knowledge Base Agent 的多 Agent 架构设计

核心痛点： 当 LLM 被用于企业级知识库时，最致命的问题不是“不会答”，而是“瞎编”。 解决方案： MITRE ATLAS 团队公开了一个精妙的解决方案：用 4 个 Prompt + 1 套路由协议 构建零幻觉的知识问答系统。

01 问题：为什么 LLM 做知识库总爱“幻觉”？

企业里做 AI 知识库问答，最常见的痛点包括：

编造数据： 模型会编造不存在的数据条目。
模糊误导： 对模糊查询给出不确定性未标注的答案。
混淆概念： 把语义相似的结果当成精确事实。
无法深度推理： 无法处理复杂的关系遍历（例如：“这个技术的父节点是什么？”）。

传统方案通常采用 RAG（检索增强生成），但简单的“检索 → 拼接 → 生成”流程无法解决置信度管理和精确性验证的问题。

MITRE ATLAS 团队的做法是：不把 LLM 当数据库用，而是让它当“协调员”。

02 架构：4 层分层 Agent 系统

整个系统只有 5 个 Prompt 文件，没有一行 Python 业务代码——所有逻辑均封装在 Langflow 的 flow JSON 中。

2.1 架构拓扑图

&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;用户查询&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ▼┌─────────────────────────────────────────┐│ &nbsp; &nbsp; &nbsp; &nbsp; Orchestrator (编排层) &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ││ &nbsp; 路由决策 + 结果综合 + 用户交互 &nbsp; &nbsp; &nbsp; &nbsp;│└─────┬──────────┬──────────┬─────────────┘&nbsp; &nbsp; &nbsp; │ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│&nbsp; &nbsp; &nbsp; ▼ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;▼ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;▼&nbsp;┌─────────┐ ┌──────────┐ ┌────────────┐&nbsp;│Vector &nbsp; │ │Dataset &nbsp; │ │Kumu Graph &nbsp;│&nbsp;│Store &nbsp; &nbsp;│ │Agent &nbsp; &nbsp; │ │Agent &nbsp; &nbsp; &nbsp; │&nbsp;│(语义) &nbsp; │ │(精确) &nbsp; &nbsp;│ │(可视化) &nbsp; &nbsp;│&nbsp;└─────────┘ └──────────┘ └────────────┘

2.2 组件职责与技术栈

数据规模： 837 个实体（12 战术 + 436 技术 + 339 缓解措施 + 50 案例研究）

03 核心设计：双层验证防幻觉

这是整个架构最精妙的部分。

3.1 语义 → 精确的双层过滤

模糊查询：“攻击者操纵训练数据会怎样？”&nbsp; &nbsp; │&nbsp; &nbsp; ├── 第一步：Vector&nbsp;Store&nbsp;Agent&nbsp;──> 返回候选（标注置信度）&nbsp; &nbsp; │ &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"最匹配 AML.T0012 — 数据投毒"&nbsp; &nbsp; │&nbsp; &nbsp; └── 第二步：Dataset&nbsp;Agent&nbsp;──> 验证候选&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"确认 AML.T0012 存在于数据集中"&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"其缓解措施为 AML.M0003, AML.M0005"&nbsp; &nbsp; │&nbsp; &nbsp; └── 第三步：Orchestrator&nbsp;──> 综合回答&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"ATLAS 将此类行为归类为 AML.T0012..."

关键约束写入 Orchestrator Prompt：

“Vector Store Agent 的结果是候选匹配，不是最终事实。必须在呈现前用 Dataset Agent 验证。”

“不要说 ‘ATLAS 最终分类为…’，除非已被 Dataset Agent 验证。”

3.2 置信度分级体系

Vector Store Agent 不是简单返回 “匹配 / 不匹配”，而是返回三级置信度 JSON：

{&nbsp;&nbsp;"status":&nbsp;"partial_match",&nbsp;&nbsp;"records": [...],&nbsp;&nbsp;"notes": [&nbsp; &nbsp;&nbsp;"AML.T0012: high confidence — 检索文本直接匹配攻击场景",&nbsp; &nbsp;&nbsp;"AML.T0034: low confidence — 仅主题相关，需验证"&nbsp; ]}

Orchestrator 收到后，对低置信度的结果会标注 “语义候选” 而非 “事实”：

“最接近的语义候选是 AML.T0034，但数据集中没有精确匹配。”

3.3 严格的路由协议

每个 Agent 都有清晰的职责边界和拒绝策略：

Vector Store Agent 必须拒绝的情况：
精确 ID 查询 → 返回 needs_dataset_lookup
计数 / 聚合 / 列表 → 返回 needs_dataset_analysis
关系遍历 / 图查询 → 返回 needs_graph_analysis
Dataset Agent 必须拒绝的情况：
模糊语义查询 →返回 needs_semantic_retrieval

设计哲学： 这种互相推诿的设计，反而保证了每个环节的专业性和准确性。

04 Dataset Agent：用 Pandas 做精确查询

Dataset Agent 没有专用数据库工具，它的唯一武器是 Python 解释器 + Pandas。所有精确操作都通过 Python 代码完成：

# 1. 精确 ID 查找df[df['id'] ==&nbsp;'AML.T0012']
# 2. 关系遍历：获取某技术的所有缓解措施row =&nbsp;df[df['id'] ==&nbsp;'AML.T0012'].iloc[0]parse_relationship(row['PARENT_MITIGATIONS'])
# 3. 聚合：统计每个战术下的技术数量df[df['entity'] ==&nbsp;'tactic'].apply(&nbsp; &nbsp; lambda r: len(parse_relationship(r['CHILD_TECHNIQUES'])))

为什么用 Pandas 而不是 SQL？

数据本身就是 CSV 格式。
Pandas 的 eval() 让 LLM 可以动态执行查询。
不需要额外部署数据库服务。
关系字段的多种格式（列表 / 序列化字符串 / 逗号分隔）在 Pandas 中更容易处理。

统一的字段解析函数

Prompt 中甚至定义了一个统一的字段解析函数，用于处理空值、NaN 及不同序列化格式：

def&nbsp;parse_relationship(value):&nbsp; &nbsp;&nbsp;if&nbsp;value&nbsp;is&nbsp;None&nbsp;or&nbsp;pd.isna(value):&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;return&nbsp;[]&nbsp; &nbsp;&nbsp;if&nbsp;isinstance(value,&nbsp;list):&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;return&nbsp;[str(v).strip()&nbsp;for&nbsp;v&nbsp;in&nbsp;value&nbsp;if&nbsp;str(v).strip()]&nbsp; &nbsp;&nbsp;# ... 后续支持 JSON 字符串、Python 字面量、逗号分隔等解析

05 Kumu Graph Agent：克制的设计哲学

Graph Agent 的设计体现了 “少即是多” 的工程哲学。它不是 “图推理 Agent”，而是纯 URL 生成器。

5.1 聚焦策略

用户：“可视化 AML.TA0011”&nbsp; &nbsp; │&nbsp; &nbsp; ├── Orchestrator 先验证 ID（通过 Dataset Agent）&nbsp; &nbsp; │&nbsp; &nbsp; └── Graph Agent 只传入&nbsp;["AML.TA0011"]&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; └── Kumu 自动显示该节点及其邻接关系

Prompt 中的严厉警告：

“不要添加父节点、子节点、缓解措施或案例研究。Kumu 会自动显示邻接关系。”
“添加额外 ID 会导致 Kumu 展开过多邻域，产生过宽的可视化。”

5.2 禁止推理

Graph Agent 的 Prompt 中明确列出了不可做的事：

❌ 不要推断关系
❌ 不要发现新实体
❌ 不要总结图内容
❌ 不要声称图是全面的
✅ 只做一件事： 把 ID 传给 Kumu API

这种极端专业化的设计，确保了可视化环节的可靠性和可预测性。

06 数据预处理：Embedding Generator

在数据入库前，系统用 LLM 批量生成以下三项内容，以实现混合检索的雏形：

命名空间体系标签示例：

#concept/prompt_injection#domain/large_language_models#risk/safeguard_bypass#behavior/instruction_manipulation#attack/data_poisoning#defense/input_validation

07 可借鉴的设计思想

7.1 面向安全团队的启示

7.2 Prompt 工程要点

该项目的 Prompt 有四个非常值得学习的共性：

负向约束多于正向指令： 包含大量 “不要做什么” 的明确禁令。
输出格式完全结构化： 每个 Agent 的 JSON Schema 在 Prompt 中均有完整定义。
边界清晰： 明确定义了每个 Agent 的拒绝策略和路由返回值。
置信度可表达： 不只有 “是 / 否”，而是采用了连续的概率与等级表达。

7.3 架构取舍

08 局限性与改进方向

虽然设计精巧，该系统仍有可提升的空间：

当前局限

检索单一： 向量检索只有向量，缺乏 BM25 混合检索。
缺乏评估： 没有 eval 测试集，无法量化衡量回答质量。
黑盒逻辑： 实际逻辑完全封装在 Langflow flow JSON 中，不可独立审计。
单点依赖： 强依赖 Langflow 平台，定制化成本较高。
开源受限： 采用非标准开源许可（MITRE 专有），商业使用受限。

改进建议

引入 Hybrid Search： 结合向量 + BM25，提升长尾词的召回率。
建立自动化评估管道： 构建 Golden QA pairs + 自动化打分机制。
解耦 Agent 逻辑： 将 Agent 逻辑提取为独立 Python 模块，减少对 Langflow 的强绑定。
优化查询体验： 支持 Cronicle / 流式（Streaming）输出，提升大规模查询体验。

09 总结

MITRE ATLAS Knowledge Base Agent 的核心价值不在于 “做了多复杂的系统”，而在于它证明了： 一个零幻觉的知识问答系统，不需要复杂的代码，只需要正确的架构和严格的 Prompt 约束。

最小可行架构： 4 个 Agent + 5 个 Prompt + 1 套路由协议 = 生产级零幻觉知识库。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：APT-101 APT-101 APT-101《如何用 4 个 Prompt 构建一个零幻觉的 AI 安全知识库？》