文章总结: leakdetector是一款面向红队和安全研究员的自动化信息泄露侦察工具,基于Bing搜索引擎dork语法结合playwright浏览器自动化技术,可高效发现公网暴露的敏感信息并自动生成报告。该工具支持多维度侦察策略(覆盖API配置、精准文件、后台系统等)、智能反爬机制(自动/手动绕过验证码)、深度内容分析(解析Excel/PDF并提取PII)及可视化关键词管理,通过高性能并发架构提升扫描效率,帮助用户快速识别信息泄露风险。 综合评分: 87 文章分类: 安全工具,渗透测试,红队,信息收集,数据安全
LeakDetector:一款自动化挖信息泄露的Bing Dork工具
幻泉之洲
2026年5月5日 16:42 北京
在小说阅读器读本章
去阅读
LeakDetector 是一款面向红队和安全研究员的自动化信息泄露侦察工具。它基于 Bing 搜索引擎的 Dork 语法,结合 Playwright 浏览器自动化,能高效发现网上暴露的敏感信息,并自动生成报告。支持多维度搜索策略、智能反爬、深度内容分析,还带可视化关键词管理。
这工具解决什么问题
搞渗透测试的都知道,信息收集是第一步,也是最耗时的环节。尤其是找那些不小心暴露在公网上的敏感文件——通讯录、身份证名单、API 密钥配置……手动搜效率低,用传统爬虫又容易被封。
LeakDetector 就是为解决这个问题来的。它用 Bing 的高级搜索语法,配合浏览器自动化,能绕过验证码,从几千个结果里自动筛出高价值目标。
核心功能
多维度 Dork 侦察策略
内置六层侦察策略(P1-P6),覆盖从基础设施到敏感数据:
- API & 配置泄露:自动发现 Swagger UI、Spring Boot Actuator、.env 等关键配置。
- 精准文件挖掘:专注 xlsx、docx、pdf,智能识别含“身份证”“手机号”“工资表”等内容的文件。
- 后台与组件识别:定位 OA 系统、后台管理入口、Jenkins/GitLab 等运维平台。
- 漏洞特征探测:识别 SQL 注入报错页面、文件上传入口、Webshell 残留。
智能浏览器引擎
集成 Playwright,彻底解决爬虫被封的问题:
- 自动/手动绕过验证码:支持检测 Bing 的 Turnstile/ReCAPTCHA,可在 GUI 中暂停并引导手动过验证。
- 动态渲染抓取:处理依赖 JS 的搜索结果,数据更完整。
深度内容分析与提取
不只是收集链接,还会下载文件并解析:
- Excel/CSV/PDF 解析:自动读取文档内容(支持多 Sheet)。
- 敏感信息正则提取:内置身份证、手机号、邮箱、学号等精准正则,自动提取 PII。
- 风险评分系统:根据泄露信息的类型和数量,用颜色标记高危条目。
高性能并发架构
用 ThreadPoolExecutor 线程池,支持 10-50 线程并发。搜索和分析线程分离,边搜边解,缩短总耗时。
可视化关键词管理
通过图形界面管理敏感检测关键词,内置 6 大预设分类(敏感入口、教育数据、商业机密、个人隐私、调试信息、凭证 Token),支持自定义扩展和恢复默认。
智能数据整理
扫描结束后自动检测未下载的文件并补全,支持多格式并行解析,自动去重分类,过滤垃圾数据。
侦察策略详解
| 级别 | 策略名称 | 描述 | 典型语法示例 | | — | — | — | — | | P1 | 基础设施 & API | 核心配置与接口暴露,杀伤力最大 | inurl:swagger, inurl:actuator/env, filename:pom.xml | | P2 | 精准文件泄露 | 针对 Excel/PDF 的精准打击,提取 PII | filetype:xlsx “通讯录”, filetype:xlsx “身份证” | | P3 | 后台与 OA | 企业级后台入口、SSO 认证、OA 系统 | inurl:login, inurl:seeyon, inurl:weaver | | P4 | 行业特征 (Edu/Gov) | 学校/政府特有敏感词 | “教务系统”, “录取名单”, “中标公告” | | P5 | 漏洞技术细节 | SQL注入报错、Webshell、上传点、源码泄露 | inurl:php?id=, intext:”sql syntax near”, ext:sql | | P6 | 运维与云设施 | DevOps 平台、VPN 入口、云存储密钥 | inurl:jenkins, filename:id_rsa, filename:web.config |
快速上手(EXE 版)
已经打包成独立的 LeakDetector.exe,不需要安装 Python。
启动
双击 LeakDetector.exe 打开图形界面。
基础配置
- 输入目标:根域名,支持批量导入。例如 example.com 或 university.edu.cn。
- 选择模式:Standard(适合教育/政府,侧重文档泄露和 PII)、Enterprise(适合企业,侧重后台/OA/DevOps)、All(执行全部 P1-P6)。
- 点击“开始扫描”按钮。
进阶:浏览器模式(强烈推荐)
默认用 HTTP 请求模式,速度快但容易封 IP。建议勾选“显示浏览器”,工具会启动 Chrome/Edge 窗口。遇到 Bing 验证码时,手动在浏览器里过滑块,然后点弹窗的“确定”,扫描继续。
配置文件说明
第一次运行后生成 config.json,可以修改高级选项:
{ “proxy_enabled”: true, “proxy_url”: “127.0.0.1:7890”, “use_browser”: false, “max_threads”: 10, “time_range”: “不限时间”, “auto_organize”: false }
关键词配置
keywords.json 在第一次使用“关键词管理”后自动生成。推荐点主界面的“关键词管理”按钮用可视化界面编辑。
{ “敏感入口/系统”: [“后台”, “管理系统”, “登录”, “Admin”], “教育敏感数据”: [“学号”, “录取”, “成绩单”], “企业商业机密”: [“合同”, “薪资”, “工资”], “个人隐私数据”: [“身份证”, “手机号”, “通讯录”], “报错/调试信息”: [“SQL syntax”, “Fatal error”], “敏感凭证/Token”: [“api_key”, “access_token”] }
运行截图
▲ 主界面:简洁直观,支持批量导入和策略选择
▲ 自动化扫描:实时显示进度和高危目标
▲ 结果分析:自动提取 Excel/PDF 中的敏感信息,风险分级
▲ 浏览器模式:辅助通过复杂的人机验证
▲ 关键词管理:可视化编辑,支持自定义规则
输出报告解读
扫描结果保存在 results/Scan_YYYYMMDD_HHMMSS/ 目录下。核心产出物是“信息泄露扫描报告_xxx.xlsx”,包含汇总详情页和扫描概览页。风险评分用红色背景标极高危(身份证/密码),黄色标中危(邮箱/手机)。下载的原始文件保存在对应文件夹,方便人工取证。
常见问题
Q1:扫描结果很少或为 0?
可能原因:目标本身安全性好,或者 Bing 对 IP 进行了风控。解决方案:务必开启“显示浏览器”模式,配合代理池或稳定的梯子。
Q2:浏览器模式启动报错?
工具依赖 Playwright,需要系统安装 Chrome 或 Edge。如果报错 Executable doesn't exist,检查浏览器是否装在默认路径。
Q3:代理连接失败?
确保代理地址格式正确(如 127.0.0.1:7890),且代理软件允许本机连接。支持 HTTP 和 Socks5。
Q4:如何自定义敏感信息检测规则?
点击主界面的“关键词管理”按钮,打开可视化编辑器。可以添加、编辑、删除关键词,或创建新分类。修改后点“保存”,配置自动保存到 keywords.json。想恢复默认就点“恢复默认”。
Q5:PDF 文件解析失败?
工具集成了 pdfplumber 库。如果日志显示“文件解析失败”但跟着分类名称(如“教育敏感数据”),实际上已经成功解析并检测到了敏感信息,只是日志显示不够直观。
关于
作者:bug_001
获取方式:私信回复”LeakDetector”获取
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:幻泉之洲 《LeakDetector:一款自动化挖信息泄露的Bing Dork工具》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







评论