2025-12-22 04:22:34 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： AuditLuma是一个创新的智能代码审计系统，采用四层RAG架构（Haystack编排+txtai检索+R2R增强+Self-RAG验证），提供全面精准的安全分析。系统支持多LLM厂商，具备跨文件安全分析、污点分析等高级功能，可自动适应项目规模，有效减少假阳性。支持多种编程语言，提供HTML/PDF/JSON格式的可视化报告，是企业级代码安全审计的强大工具。 综合评分： 89 文章分类： 代码审计,AI安全,安全工具,安全开发,应用安全

cover_image

高级代码审计AI系统—–AuditLuma

Vistaminc

知微守望

2025年11月3日 20:44 浙江

AuditLuma是一个智能代码审计系统，采用创新的层级RAG架构，结合多个AI代理和先进技术，包括Haystack-AI编排器、txtai知识检索、R2R上下文增强和Self-RAG验证，为代码库提供全面、精准的安全分析。

🌟 架构亮点

🏗️ 层级RAG架构 – 四层智能架构：Haystack编排 + txtai检索 + R2R增强 + Self-RAG验证
🚀 Haystack-AI编排器 – 智能任务分解和结果整合，支持传统编排器回退
🔍 智能知识检索 – txtai驱动的语义检索和上下文理解
🎯 精准验证 – Self-RAG多模型交叉验证，有效减少假阳性
🔄 自适应架构 – 根据项目规模自动选择最优架构模式

✨ 核心特性

🏗️ 层级RAG架构

Haystack编排层
智能任务分解、并行执行和结果整合
txtai知识检索层
语义检索和上下文理解
R2R上下文增强层
动态上下文扩展和关联分析
Self-RAG验证层
多模型交叉验证和假阳性过滤

🚀 智能编排系统

Haystack-AI编排器
基于AI的智能任务编排（推荐）
传统编排器
规则驱动的稳定编排方案
自动回退机制
AI编排器不可用时自动切换
动态架构选择
根据项目规模自动选择最优架构

🔍 高级分析能力

🛡️ 综合安全分析 – 全面检测漏洞并提出有效修复建议
🌐 跨文件安全分析 – 检测传统单文件分析无法发现的跨文件漏洞
📊 全局上下文构建 – 构建代码调用图、数据流图和依赖关系
🎯 污点分析 – 追踪用户输入在代码中的传播路径
🔄 MCP（多代理合作协议） – 增强代理之间的协调与合作

🌐 企业级支持

多LLM厂商支持
支持OpenAI、DeepSeek、MoonShot、通义千问等多家厂商
自动厂商检测
根据模型名称自动识别并配置正确的厂商API
异步并行处理
使用异步并发技术提高性能，加快分析速度
可视化功能
生成依赖关系图和详细安全报告

📋 目录

快速开始
层级RAG架构
文档
安装
使用
配置
支持语言
架构
报告格式
贡献
许可证

🚀 快速开始

#&nbsp;1. 克隆项目git clone https://github.com/Vistaminc/AuditLuma.gitcd&nbsp;AuditLuma#&nbsp;2. 安装依赖pip install -r requirements.txt#&nbsp;3. 使用层级RAG架构分析（推荐）python main.py --architecture hierarchical --haystack-orchestrator ai -d ./your-project#&nbsp;4. 查看架构信息python main.py --show-architecture-info

🏗️ 层级RAG架构

AuditLuma 2.0引入了创新的四层RAG架构，显著提升分析精度和效率：

┌─────────────────────────────────────────────────────────────┐
│ &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;层级RAG架构 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
├─────────────────────────────────────────────────────────────┤
│ 第一层：Haystack编排层 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
│ ├─ Haystack-AI编排器（推荐）- 智能任务分解和结果整合 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
│ └─ 传统编排器 - 规则驱动的稳定方案 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
├─────────────────────────────────────────────────────────────┤
│ 第二层：txtai知识检索层 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
│ ├─ 语义检索和相似性匹配 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
│ └─ 上下文理解和知识图谱构建 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
├─────────────────────────────────────────────────────────────┤
│ 第三层：R2R上下文增强层 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
│ ├─ 动态上下文扩展 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
│ └─ 关联分析和依赖追踪 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
├─────────────────────────────────────────────────────────────┤
│ 第四层：Self-RAG验证层 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
│ ├─ 多模型交叉验证 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;│
│ └─ 假阳性过滤和置信度评估 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; │
└─────────────────────────────────────────────────────────────┘

架构优势

🎯 精准度提升
四层验证机制，显著减少假阳性
⚡ 性能优化
智能缓存和并行处理，提升分析速度
🔄 自适应
根据项目规模自动选择最优配置
🛡️ 可靠性
多重回退机制，确保系统稳定运行

📚 文档

🚀 入门指南

安装指南 – 详细的安装步骤和环境配置
用户指南 – 从入门到精通的完整使用教程
快速参考 – 常用命令和配置速查手册

🏗️ 核心文档

层级RAG架构指南 – 详细的层级RAG架构说明和使用指南
配置参考 – 完整的配置选项和参数说明
最佳实践 – 使用建议、性能优化和安全配置

🔧 技术文档

架构设计 – 系统架构和设计理念
故障排除指南 – 常见问题、错误诊断和解决方案
项目结构 – 详细的项目目录结构和模块说明

📖 在线资源

AuditLuma 相关文档 – 完整的在线文档和教程

🚀 安装

克隆仓库并安装依赖：

git clone https://github.com/Vistaminc/AuditLuma.gitcd&nbsp;AuditLuma pip install -r requirements.txt

可选依赖

FAISS向量检索库

默认情况下，AuditLuma会使用一个简单的内置向量存储实现。如果需要处理大型代码库，建议安装FAISS以提高性能：

# CPU版本pip&nbsp;install faiss-cpu
# GPU版本(支持CUDA)pip install faiss-gpu

安装FAISS后，系统将自动检测并使用它进行向量存储和检索，显著提高分析大型项目时的性能。

🛠 使用

基本用法

# 使用层级RAG架构（推荐）python&nbsp;main.py&nbsp;--architecture&nbsp;hierarchical -d ./your-project -o ./reports
# 使用Haystack-AI编排器（默认，推荐）python&nbsp;main.py&nbsp;--architecture&nbsp;hierarchical&nbsp;--haystack-orchestrator&nbsp;ai -d ./your-project
# 使用传统编排器python&nbsp;main.py&nbsp;--architecture&nbsp;hierarchical&nbsp;--haystack-orchestrator&nbsp;traditional -d ./your-project
# 自动选择架构（根据项目规模）python&nbsp;main.py&nbsp;--architecture&nbsp;auto -d ./your-project
# 传统RAG架构（向后兼容）python&nbsp;main.py&nbsp;--architecture&nbsp;traditional -d ./your-project

#

高级用法

# 启用性能对比模式python&nbsp;main.py&nbsp;--architecture&nbsp;hierarchical&nbsp;--enable-performance-comparison&nbsp;-d ./your-project
# 查看架构信息和配置python&nbsp;main.py&nbsp;--show-architecture-info
# 配置迁移（从传统配置升级到层级RAG）python&nbsp;main.py&nbsp;--config-migrate
# AI增强的跨文件分析python&nbsp;main.py&nbsp;--architecture&nbsp;hierarchical&nbsp;--enhanced-analysis&nbsp;-d ./your-project

命令行参数

基础参数

架构选择参数

| 参数 | 说明 | 默认值 | | — | — | — | | --architecture | RAG架构模式(traditional/hierarchical/auto) | auto | | --haystack-orchestrator | Haystack编排器类型(traditional/ai) | ai | | --force-traditional | 强制使用传统RAG架构 | – | | --force-hierarchical | 强制使用层级RAG架构 | – | | --enable-performance-comparison | 启用性能对比模式 | – | | --auto-switch-threshold | 自动切换架构的文件数量阈值 | 100 |

层级RAG特定参数

| 参数 | 说明 | 默认值 | | — | — | — | | --enable-txtai | 启用txtai知识检索层 | – | | --enable-r2r | 启用R2R上下文增强层 | – | | --enable-self-rag-validation | 启用Self-RAG验证层 | – | | --disable-caching | 禁用层级缓存系统 | – | | --disable-monitoring | 禁用性能监控 | – |

传统功能参数

其他参数

| 参数 | 说明 | 默认值 | | — | — | — | | --verbose | 启用详细日志记录 | 默认禁用 | | --dry-run | 试运行模式（不执行实际分析） | – | | --config-migrate | 迁移配置到层级RAG格式 | – | | --show-architecture-info | 显示当前架构信息并退出 | – |

⚙️ 配置

通过编辑config/config.yaml文件配置系统。AuditLuma 2.0支持层级RAG架构配置。

层级RAG配置

# 层级RAG架构模型配置hierarchical_rag_models:&nbsp;&nbsp;# 是否启用层级RAG架构&nbsp; enabled: true
&nbsp;&nbsp;# Haystack编排层配置&nbsp; haystack:&nbsp; &nbsp;&nbsp;# 编排器类型选择：traditional（传统）或 ai（Haystack-AI，推荐）&nbsp; &nbsp; orchestrator_type:&nbsp;"ai"&nbsp;&nbsp;# 默认使用Haystack-AI编排器
&nbsp; &nbsp;&nbsp;# 默认模型（支持 model@provider 格式）&nbsp; &nbsp; default_model:&nbsp;"qwen3:32b@ollama"
&nbsp; &nbsp;&nbsp;# 任务特定模型配置&nbsp; &nbsp; task_models:&nbsp; &nbsp; &nbsp; security_scan:&nbsp;"gpt-4@openai"&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;# 安全扫描使用更强的模型&nbsp; &nbsp; &nbsp; syntax_check:&nbsp;"deepseek-chat@deepseek"&nbsp;# 语法检查&nbsp; &nbsp; &nbsp; logic_analysis:&nbsp;"qwen-turbo@qwen"&nbsp;# 逻辑分析&nbsp; &nbsp; &nbsp; dependency_analysis:&nbsp;"gpt-3.5-turbo@openai"&nbsp;# 依赖分析
&nbsp;&nbsp;# txtai知识检索层模型配置&nbsp; txtai:&nbsp; &nbsp; retrieval_model:&nbsp;"gpt-3.5-turbo@openai"&nbsp;&nbsp;# 知识检索模型&nbsp; &nbsp; embedding_model:&nbsp;"text-embedding-ada-002@openai"&nbsp;&nbsp;# 嵌入模型
&nbsp;&nbsp;# R2R上下文增强层模型配置&nbsp; r2r:&nbsp; &nbsp; context_model:&nbsp;"gpt-3.5-turbo@openai"&nbsp; &nbsp;&nbsp;# 上下文分析模型&nbsp; &nbsp; enhancement_model:&nbsp;"gpt-3.5-turbo@openai"&nbsp;# 增强模型
&nbsp;&nbsp;# Self-RAG验证层模型配置&nbsp; self_rag_validation:&nbsp; &nbsp; validation_model:&nbsp;"gpt-3.5-turbo@openai"&nbsp;&nbsp;# 主验证模型&nbsp; &nbsp; cross_validation_models: &nbsp;# 交叉验证使用的多个模型&nbsp; &nbsp; &nbsp; -&nbsp;"gpt-4@openai"&nbsp; &nbsp; &nbsp; -&nbsp;"deepseek-chat@deepseek"&nbsp; &nbsp; &nbsp; -&nbsp;"gpt-3.5-turbo@openai"

模型规范格式

AuditLuma支持使用统一的模型规范格式 model@provider 来指定模型和提供商：

deepseek-chat@deepseek &nbsp;# 指定使用DeepSeek提供商的deepseek-chat模型
gpt-4-turbo@openai &nbsp; &nbsp; &nbsp;# 指定使用OpenAI提供商的gpt-4-turbo模型
qwen-turbo@qwen &nbsp; &nbsp; &nbsp; &nbsp; # 指定使用通义千问提供商的qwen-turbo模型

如果不指定提供商（不使用@符号），系统将自动根据模型名称推断提供商。

架构选择配置

#&nbsp;全局设置global: &nbsp;#&nbsp;默认架构模式：traditional, hierarchical, autodefault_architecture:&nbsp;"hierarchical"#&nbsp;自动切换阈值（文件数量）auto_switch_threshold:&nbsp;100#&nbsp;是否启用性能对比enable_performance_comparison:&nbsp;false

多厂商支持

AuditLuma支持多家LLM厂商，并能根据模型名称自动检测厂商：

-注意：openai厂商可以对接所有openai格式的中转平台

💻 支持语言

AuditLuma支持分析以下编程语言：

主要语言（包括排名前10）

Python (.py)
JavaScript (.js, .jsx)
TypeScript (.ts, .tsx)
Java (.java)
C# (.cs)
C++ (.cpp, .cc, .hpp)
C (.c, .h)
Go (.go)
Ruby (.rb)
PHP (.php)
Lua (.lua)

其他支持的语言

Rust (.rs)
Swift (.swift)
Kotlin (.kt)
Scala (.scala)
Dart (.dart)
Bash (.sh, .bash)
PowerShell (.ps1, .psm1)

标记和配置语言

HTML (.html, .htm)
CSS (.css)
JSON (.json)
XML (.xml)
YAML (.yml, .yaml)
SQL (.sql)

🏛 架构

AuditLuma使用多代理架构，包含以下组件：

Agent Orchestrator

协调工作流中的所有代理

代码分析代理

分析代码结构并提取依赖关系

安全分析代理

识别安全漏洞

修复建议代理

生成针对性漏洞修复方案

可视化组件

生成直观的报告和依赖关系图

📊 报告格式

AuditLuma支持以下报告格式：

📋 HTML报告 – 包含漏洞详情、统计图表和交互式可视化
📄 PDF报告 – 适合打印和分享的格式
🔄 JSON报告 – 适合进一步处理和集成的机器可读格式

💬 贡献

欢迎贡献代码和建议！请遵循以下步骤：

Fork 仓库
创建特性分支 (git checkout -b feature/amazing-feature)
提交更改 (git commit -m 'Add some amazing feature')
推送到分支 (git push origin feature/amazing-feature)
创建Pull Request

使用体验

参考链接

https://github.com/Vistaminc/AuditLuma

真心感觉自己要学习的知识好多，也有好多大神卧虎藏龙、开源分享。作为初学者，我们可能有差距，不论你之前是什么方向，是什么工作，是什么学历，是大学大专中专，亦或是高中初中，只要你喜欢安全，喜欢渗透，就朝着这个目标去努力吧！有差距不可怕，我们需要的是去缩小差距，去战斗，况且这个学习的历程真的很美，安全真的有意思。但切勿去做坏事，我们需要的是白帽子，是维护我们的网络，安全路上共勉。

本文版权归作者和微信公众号平台共有，重在学习交流，不以任何盈利为目的，欢迎转载。

由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，文章作者不为此承担任何责任。公众号内容中部分攻防技巧等只允许在目标授权的情况下进行使用，大部分文章来自各大安全社区，个人博客，如有侵权请立即联系公众号进行删除。若不同意以上警告信息请立即退出浏览！！！

敲敲小黑板：《刑法》第二百八十五条　【非法侵入计算机信息系统罪；非法获取计算机信息系统数据、非法控制计算机信息系统罪】违反国家规定，侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的，处三年以下有期徒刑或者拘役。违反国家规定，侵入前款规定以外的计算机信息系统或者采用其他技术手段，获取该计算机信息系统中存储、处理或者传输的数据，或者对该计算机信息系统实施非法控制，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

查看原文：《高级代码审计AI系统—–AuditLuma》