文章总结: 本文推荐一款名为ShitJournalCrawler的开源爬虫工具,用于从特定站点批量下载无水印PDF期刊。工具提供命令行与图形界面双模式,支持自动按标题作者重命名文件、TXT批量链接下载、多种代理协议、任务控制及跨平台安全命名处理,有效解决手工整理文献耗时且易乱的痛点,适合需要系统归档资料的用户使用。 综合评分: 65 文章分类: 爬虫,安全工具
开源工具推荐:S.H.I.T构石期刊无水印PDF下载器
原创
佚名 佚名
星宇Sec
2026年4月8日 19:33 山东
在小说阅读器读本章
去阅读
仓库名:ShitJournalCrawler 地址:https://github.com/ThanatosXingYu/ShitJournalCrawler
最近在看社区里的整活论文时,我遇到一个非常现实的问题: 链接能刷到,资料却很难整理。文章分散在聊天记录、收藏夹和浏览器标签页里,想系统归档很费时间。
所以我做了一个开源小工具:ShitJournalCrawler。
它支持从文章链接自动提取元信息,下载 PDF,并按“标题 – 作者”命名,支持单篇和批量。
这个项目解决了什么?
- 下载步骤太碎:点开、另存、改名,重复劳动很多。
- 批量整理困难:几十个链接手工处理容易漏。
- 文件管理混乱:命名不统一,后续检索困难。
- 跨平台兼容问题:Windows/macOS 文件名规则不同,容易报错。
核心能力
- 双站点支持:
shitspace.xyzshitjournal.org
- 双使用方式:
- 命令行(适合批量与自动化)
- GUI 桌面界面(适合日常点击使用)
- 批量下载:
- 支持 TXT 多行链接读取并批量执行
- 自动命名:
- 保存为
标题 - 作者.pdf
- 代理支持:
- 支持
HTTP/HTTPS/SOCKS5 - 适配
shitjournal.org等需要代理访问的场景
- 任务控制:
- 支持“暂停/继续”
- 支持“强行停止”
- 跨平台安全命名:
- 自动处理非法字符
- 自动处理 Windows 保留名(如
CON/AUX/NUL/COM1...)
快速开始
pip install -r requirements.txt
#GUI版
python3 article_downloader_gui.py
#CLI版
python3 article_downloader_cli.py --url "https://shitjournal.org/preprints/58fa9d57-4aa8-4f18-bad7-25a88b5b5a29" --proxy "socks5h://127.0.0.1:1080"
结尾
好工具不一定复杂,但一定能稳定帮你省时间。欢迎各位一起改进这个项目,好用的话可以点个Star
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:星宇Sec 佚名 佚名《开源工具推荐:S.H.I.T构石期刊无水印PDF下载器》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







![[工具推荐]BurpSuite多漏洞自动化探测插件xia_tan(瞎探)](/images/random/titlepic/12.jpg)
评论