2026-05-06 05:01:55 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： leakdetector是一款面向红队和安全研究员的自动化信息泄露侦察工具，基于Bing搜索引擎dork语法结合playwright浏览器自动化技术，可高效发现公网暴露的敏感信息并自动生成报告。该工具支持多维度侦察策略（覆盖API配置、精准文件、后台系统等）、智能反爬机制（自动/手动绕过验证码）、深度内容分析（解析Excel/PDF并提取PII）及可视化关键词管理，通过高性能并发架构提升扫描效率，帮助用户快速识别信息泄露风险。 综合评分： 87 文章分类： 安全工具,渗透测试,红队,信息收集,数据安全

cover_image

LeakDetector：一款自动化挖信息泄露的Bing Dork工具

幻泉之洲

2026年5月5日 16:42 北京

在小说阅读器读本章

去阅读

LeakDetector 是一款面向红队和安全研究员的自动化信息泄露侦察工具。它基于 Bing 搜索引擎的 Dork 语法，结合 Playwright 浏览器自动化，能高效发现网上暴露的敏感信息，并自动生成报告。支持多维度搜索策略、智能反爬、深度内容分析，还带可视化关键词管理。

这工具解决什么问题

搞渗透测试的都知道，信息收集是第一步，也是最耗时的环节。尤其是找那些不小心暴露在公网上的敏感文件——通讯录、身份证名单、API 密钥配置……手动搜效率低，用传统爬虫又容易被封。

LeakDetector 就是为解决这个问题来的。它用 Bing 的高级搜索语法，配合浏览器自动化，能绕过验证码，从几千个结果里自动筛出高价值目标。

核心功能

多维度 Dork 侦察策略

内置六层侦察策略（P1-P6），覆盖从基础设施到敏感数据：

API & 配置泄露：自动发现 Swagger UI、Spring Boot Actuator、.env 等关键配置。
精准文件挖掘：专注 xlsx、docx、pdf，智能识别含“身份证”“手机号”“工资表”等内容的文件。
后台与组件识别：定位 OA 系统、后台管理入口、Jenkins/GitLab 等运维平台。
漏洞特征探测：识别 SQL 注入报错页面、文件上传入口、Webshell 残留。

智能浏览器引擎

集成 Playwright，彻底解决爬虫被封的问题：

自动/手动绕过验证码：支持检测 Bing 的 Turnstile/ReCAPTCHA，可在 GUI 中暂停并引导手动过验证。
动态渲染抓取：处理依赖 JS 的搜索结果，数据更完整。

深度内容分析与提取

不只是收集链接，还会下载文件并解析：

Excel/CSV/PDF 解析：自动读取文档内容（支持多 Sheet）。
敏感信息正则提取：内置身份证、手机号、邮箱、学号等精准正则，自动提取 PII。
风险评分系统：根据泄露信息的类型和数量，用颜色标记高危条目。

高性能并发架构

用 ThreadPoolExecutor 线程池，支持 10-50 线程并发。搜索和分析线程分离，边搜边解，缩短总耗时。

可视化关键词管理

通过图形界面管理敏感检测关键词，内置 6 大预设分类（敏感入口、教育数据、商业机密、个人隐私、调试信息、凭证 Token），支持自定义扩展和恢复默认。

智能数据整理

扫描结束后自动检测未下载的文件并补全，支持多格式并行解析，自动去重分类，过滤垃圾数据。

侦察策略详解

快速上手（EXE 版）

已经打包成独立的 LeakDetector.exe，不需要安装 Python。

启动

双击 LeakDetector.exe 打开图形界面。

基础配置

输入目标：根域名，支持批量导入。例如 example.com 或 university.edu.cn。
选择模式：Standard（适合教育/政府，侧重文档泄露和 PII）、Enterprise（适合企业，侧重后台/OA/DevOps）、All（执行全部 P1-P6）。
点击“开始扫描”按钮。

进阶：浏览器模式（强烈推荐）

默认用 HTTP 请求模式，速度快但容易封 IP。建议勾选“显示浏览器”，工具会启动 Chrome/Edge 窗口。遇到 Bing 验证码时，手动在浏览器里过滑块，然后点弹窗的“确定”，扫描继续。

配置文件说明

第一次运行后生成 config.json，可以修改高级选项：

{ “proxy_enabled”: true, “proxy_url”: “127.0.0.1:7890”, “use_browser”: false, “max_threads”: 10, “time_range”: “不限时间”, “auto_organize”: false }

关键词配置

keywords.json 在第一次使用“关键词管理”后自动生成。推荐点主界面的“关键词管理”按钮用可视化界面编辑。

{ “敏感入口/系统”: [“后台”, “管理系统”, “登录”, “Admin”], “教育敏感数据”: [“学号”, “录取”, “成绩单”], “企业商业机密”: [“合同”, “薪资”, “工资”], “个人隐私数据”: [“身份证”, “手机号”, “通讯录”], “报错/调试信息”: [“SQL syntax”, “Fatal error”], “敏感凭证/Token”: [“api_key”, “access_token”] }

运行截图

▲ 主界面：简洁直观，支持批量导入和策略选择

▲ 自动化扫描：实时显示进度和高危目标

▲ 结果分析：自动提取 Excel/PDF 中的敏感信息，风险分级

▲ 浏览器模式：辅助通过复杂的人机验证

▲ 关键词管理：可视化编辑，支持自定义规则

输出报告解读

扫描结果保存在 results/Scan_YYYYMMDD_HHMMSS/ 目录下。核心产出物是“信息泄露扫描报告_xxx.xlsx”，包含汇总详情页和扫描概览页。风险评分用红色背景标极高危（身份证/密码），黄色标中危（邮箱/手机）。下载的原始文件保存在对应文件夹，方便人工取证。

常见问题

Q1：扫描结果很少或为 0？

可能原因：目标本身安全性好，或者 Bing 对 IP 进行了风控。解决方案：务必开启“显示浏览器”模式，配合代理池或稳定的梯子。

Q2：浏览器模式启动报错？

工具依赖 Playwright，需要系统安装 Chrome 或 Edge。如果报错 Executable doesn't exist，检查浏览器是否装在默认路径。

Q3：代理连接失败？

确保代理地址格式正确（如 127.0.0.1:7890），且代理软件允许本机连接。支持 HTTP 和 Socks5。

Q4：如何自定义敏感信息检测规则？

点击主界面的“关键词管理”按钮，打开可视化编辑器。可以添加、编辑、删除关键词，或创建新分类。修改后点“保存”，配置自动保存到 keywords.json。想恢复默认就点“恢复默认”。

Q5：PDF 文件解析失败？

工具集成了 pdfplumber 库。如果日志显示“文件解析失败”但跟着分类名称（如“教育敏感数据”），实际上已经成功解析并检测到了敏感信息，只是日志显示不够直观。

关于

作者：bug_001

获取方式：私信回复”LeakDetector”获取

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：幻泉之洲《LeakDetector：一款自动化挖信息泄露的Bing Dork工具》