开源工具推荐:S.H.I.T构石期刊无水印PDF下载器

admin 2026-04-26 04:40:46 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文推荐一款名为ShitJournalCrawler的开源爬虫工具,用于从特定站点批量下载无水印PDF期刊。工具提供命令行与图形界面双模式,支持自动按标题作者重命名文件、TXT批量链接下载、多种代理协议、任务控制及跨平台安全命名处理,有效解决手工整理文献耗时且易乱的痛点,适合需要系统归档资料的用户使用。 综合评分: 65 文章分类: 爬虫,安全工具


cover_image

开源工具推荐:S.H.I.T构石期刊无水印PDF下载器

原创

佚名 佚名

星宇Sec

2026年4月8日 19:33 山东

在小说阅读器读本章

去阅读

仓库名:ShitJournalCrawler 地址:https://github.com/ThanatosXingYu/ShitJournalCrawler

最近在看社区里的整活论文时,我遇到一个非常现实的问题: 链接能刷到,资料却很难整理。文章分散在聊天记录、收藏夹和浏览器标签页里,想系统归档很费时间。

所以我做了一个开源小工具:ShitJournalCrawler

它支持从文章链接自动提取元信息,下载 PDF,并按“标题 – 作者”命名,支持单篇和批量。

这个项目解决了什么?

  1. 下载步骤太碎:点开、另存、改名,重复劳动很多。
  2. 批量整理困难:几十个链接手工处理容易漏。
  3. 文件管理混乱:命名不统一,后续检索困难。
  4. 跨平台兼容问题:Windows/macOS 文件名规则不同,容易报错。

核心能力

  1. 双站点支持:
  • shitspace.xyz
  • shitjournal.org
  1. 双使用方式:
  • 命令行(适合批量与自动化)
  • GUI 桌面界面(适合日常点击使用)
  1. 批量下载:
  • 支持 TXT 多行链接读取并批量执行
  1. 自动命名:
  • 保存为 标题 - 作者.pdf
  1. 代理支持:
  • 支持 HTTP/HTTPS/SOCKS5
  • 适配 shitjournal.org 等需要代理访问的场景
  1. 任务控制:
  • 支持“暂停/继续”
  • 支持“强行停止”
  1. 跨平台安全命名:
  • 自动处理非法字符
  • 自动处理 Windows 保留名(如 CON/AUX/NUL/COM1...

快速开始

pip install -r requirements.txt

#GUI版
python3 article_downloader_gui.py

#CLI版
python3 article_downloader_cli.py --url "https://shitjournal.org/preprints/58fa9d57-4aa8-4f18-bad7-25a88b5b5a29" --proxy "socks5h://127.0.0.1:1080"

结尾

好工具不一定复杂,但一定能稳定帮你省时间。欢迎各位一起改进这个项目,好用的话可以点个Star


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:星宇Sec 佚名 佚名《开源工具推荐:S.H.I.T构石期刊无水印PDF下载器》

评论:0   参与:  0