22岁开发者逆天复现ClaudeMythos!GitHub狂揽1.1万Star,CTF挑战成功率73%

admin 2026-05-11 08:11:59 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 22岁开发者KyeGomez基于公开论文逆向复现Anthropic未开源的ClaudeMythos模型,创建OpenMythos项目。该项目采用循环Transformer架构,通过权重重复使用而非堆叠参数提升性能,770M参数模型可对标1.3B传统模型。核心创新包括循环推理机制、MoE+MLA混合架构及数学级稳定训练,支持CTF攻防与网络攻击链自动化。项目开源4天获1.1万Star,但缺乏预训练权重与实测验证。 综合评分: 83 文章分类: AI安全,二进制安全,安全工具,技术标准,其他


cover_image

22岁开发者逆天复现Claude Mythos!GitHub狂揽1.1万Star,CTF挑战成功率73%

原创

hacking hacking

Hacking黑白红

2026年5月7日 22:19 安徽

在小说阅读器读本章

去阅读

Anthropic藏了个王炸模型——Claude Mythos Preview。

不对外开源、不公开发布、仅给40余家技术联盟内测,原因很简单:

能力强到危险。英国AI安全研究所测试显示,它能自主跑完32步企业网络攻击链,CTF挑战成功率73%。

没人知道它的真实架构,没有论文、没有报告,Anthropic守口如瓶。

直到一位22岁开源开发者Kye Gomez,凭公开论文线索,用PyTorch把这个“神秘架构”逆向复现,项目OpenMythos开源4天近7000 Star,如今突破1.1万,GitHub评论区吵翻了天。

被锁起来的超级模型:Mythos为何不敢开放?

Claude Mythos属于Anthropic的Project Glasswing计划,专供关键基础设施安全评估,官方明确表态:无公开发布计划。

它的恐怖之处在于:

 自主完成完整企业网络攻击,人类专家需20小时,它一键跑完

 专家级CTF攻防挑战,成功率73%

 强推理、长逻辑、高风险,直接被“锁进保险柜”

官方不公开架构,等于把复现之路堵死。但这位22岁开发者,硬是靠“猜+推导”,写出了整套代码。

颠覆范式:不堆层数,靠“反复思考”提升能力

传统大模型(GPT、LLaMA)靠堆层数、堆参数变强,100层不够就200层,参数量水涨船高。

OpenMythos走了条完全相反的路:不堆层数,让同一组权重循环跑多遍。

类比理解:

 传统模型:翻书,一页一页读完就结束

 OpenMythos:反复精读同一段,每一遍都加深理解

效果惊人:770M参数循环模型,性能对标1.3B传统Transformer,参数量直接省近一半,训练与部署成本大幅降低。

三大核心亮点:循环架构+稳定训练,革Transformers命

OpenMythos架构分为三段:前奏层(Prelude) + 循环块(Recurrent Block) + 尾声层(Coda),核心创新全在中间的循环块。

  1. 循环推理,深度外推超强

 每轮循环都在前一轮基础上深化推理,不是简单重复

 训练跑16轮,推理可直接跑24/32轮,泛化能力拉满

 简单问题少跑轮次,难题多算几遍,只改参数不动模型

  1. MoE+MLA双加持,显存暴减

 集成MoE混合专家,不同深度激活不同专家子集

 支持MLA注意力,KV缓存缩小10-20倍

 兼容GQA+Flash Attention 2,速度与效率兼顾

 ACT自适应计算:简单token早退出,复杂token多计算

  1. 数学级稳定,训练不炸

循环Transformer的世纪难题是梯度爆炸/消失,OpenMythos用LTI注入从数学层面解决:

 状态更新按线性时不变系统构造

 谱半径严格小于1,学习率再高也稳定

 对数空间计算+精度保护,杜绝溢出

争议拉满:天才之作,还是空中楼阁?

OpenMythos现在的状态很真实:

✅ 代码可编译,架构逻辑自洽

✅ 提供1B~1T七档模型配置

✅ 支持pip一键安装

❌ 无训练好的权重

❌ 无官方Benchmark

❌ 无实际推理演示

它本质是对Mythos架构的假设性实现,不是可直接商用的模型。GitHub上两极分化:

有人夸天才,有人直言“这很愚蠢”,

但没人能否定——它给出了一个可被证伪、可落地验证的具体方向。

一键使用:极简部署,人人可测

安装一行命令搞定:

bash

pip install open-mythos

极简调用示例:

python

import torch

from open_mythos import OpenMythos, mythos_1b

from open_mythos.tokenizer import MythosTokenizer

加载1B模型

config = mythos_1b()

model = OpenMythos(config)

tokenizer = MythosTokenizer()

推理生成

ids = torch.tensor([tokenizer.encode(“Explain quantum computing”)])

output = model.generate(ids, max_new_tokens=512, temperature=0.7)

支持PyTorch FSDP分布式训练,默认使用FineWeb-Edu数据集,开箱即用。

最后

OpenMythos可能不是100%还原Claude Mythos,但它把大模型的“缩放之争”,从堆多少参数推向了推理算多少轮。

770M干翻1.3B,循环深度Transformer,或许就是下一代大模型的破局方向。

22岁开发者,凭一己之力挑战巨头闭源黑箱,这正是开源AI最迷人的地方。

项目地址:https://github.com/kyegomez/OpenMythos

作者:hacking。前北漂程序员,现在做安全。

文章数据来自网络,大模型优化,侵权删。

往期相关回顾

突发!意大利批准:美国引渡中国工程师徐泽伟

DeepSeek现在我是你爹了

苹果突发“社死”现场!一个文件忘删,4万亿AI家底全曝光

体制内vs大厂:当初选“稳”的人,现在后悔了吗?

炸场!2026年4月GitHub爆火11个开源项目,第3个Hermes封神


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:Hacking黑白红 hacking hacking《22岁开发者逆天复现Claude Mythos!GitHub狂揽1.1万Star,CTF挑战成功率73%》

评论:0   参与:  0