2026-05-11 08:11:59 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 22岁开发者KyeGomez基于公开论文逆向复现Anthropic未开源的ClaudeMythos模型，创建OpenMythos项目。该项目采用循环Transformer架构，通过权重重复使用而非堆叠参数提升性能，770M参数模型可对标1.3B传统模型。核心创新包括循环推理机制、MoE+MLA混合架构及数学级稳定训练，支持CTF攻防与网络攻击链自动化。项目开源4天获1.1万Star，但缺乏预训练权重与实测验证。 综合评分： 83 文章分类： AI安全,二进制安全,安全工具,技术标准,其他

cover_image

22岁开发者逆天复现Claude Mythos！GitHub狂揽1.1万Star，CTF挑战成功率73%

原创

hacking hacking

Hacking黑白红

2026年5月7日 22:19 安徽

在小说阅读器读本章

去阅读

Anthropic藏了个王炸模型——Claude Mythos Preview。

不对外开源、不公开发布、仅给40余家技术联盟内测，原因很简单：

能力强到危险。英国AI安全研究所测试显示，它能自主跑完32步企业网络攻击链，CTF挑战成功率73%。

没人知道它的真实架构，没有论文、没有报告，Anthropic守口如瓶。

直到一位22岁开源开发者Kye Gomez，凭公开论文线索，用PyTorch把这个“神秘架构”逆向复现，项目OpenMythos开源4天近7000 Star，如今突破1.1万，GitHub评论区吵翻了天。

被锁起来的超级模型：Mythos为何不敢开放？

Claude Mythos属于Anthropic的Project Glasswing计划，专供关键基础设施安全评估，官方明确表态：无公开发布计划。

它的恐怖之处在于：

自主完成完整企业网络攻击，人类专家需20小时，它一键跑完

专家级CTF攻防挑战，成功率73%

强推理、长逻辑、高风险，直接被“锁进保险柜”

官方不公开架构，等于把复现之路堵死。但这位22岁开发者，硬是靠“猜+推导”，写出了整套代码。

颠覆范式：不堆层数，靠“反复思考”提升能力

传统大模型（GPT、LLaMA）靠堆层数、堆参数变强，100层不够就200层，参数量水涨船高。

OpenMythos走了条完全相反的路：不堆层数，让同一组权重循环跑多遍。

类比理解：

传统模型：翻书，一页一页读完就结束

OpenMythos：反复精读同一段，每一遍都加深理解

效果惊人：770M参数循环模型，性能对标1.3B传统Transformer，参数量直接省近一半，训练与部署成本大幅降低。

三大核心亮点：循环架构+稳定训练，革Transformers命

OpenMythos架构分为三段：前奏层(Prelude) + 循环块(Recurrent Block) + 尾声层(Coda)，核心创新全在中间的循环块。

循环推理，深度外推超强

每轮循环都在前一轮基础上深化推理，不是简单重复

训练跑16轮，推理可直接跑24/32轮，泛化能力拉满

简单问题少跑轮次，难题多算几遍，只改参数不动模型

MoE+MLA双加持，显存暴减

集成MoE混合专家，不同深度激活不同专家子集

支持MLA注意力，KV缓存缩小10-20倍

兼容GQA+Flash Attention 2，速度与效率兼顾

ACT自适应计算：简单token早退出，复杂token多计算

数学级稳定，训练不炸

循环Transformer的世纪难题是梯度爆炸/消失，OpenMythos用LTI注入从数学层面解决：

状态更新按线性时不变系统构造

谱半径严格小于1，学习率再高也稳定

对数空间计算+精度保护，杜绝溢出

争议拉满：天才之作，还是空中楼阁？

OpenMythos现在的状态很真实：

✅ 代码可编译，架构逻辑自洽

✅ 提供1B~1T七档模型配置

✅ 支持pip一键安装

❌ 无训练好的权重

❌ 无官方Benchmark

❌ 无实际推理演示

它本质是对Mythos架构的假设性实现，不是可直接商用的模型。GitHub上两极分化：

有人夸天才，有人直言“这很愚蠢”，

但没人能否定——它给出了一个可被证伪、可落地验证的具体方向。

一键使用：极简部署，人人可测

安装一行命令搞定：

bash

pip install open-mythos

极简调用示例：

python

import torch

from open_mythos import OpenMythos, mythos_1b

from open_mythos.tokenizer import MythosTokenizer

加载1B模型

config = mythos_1b()

model = OpenMythos(config)

tokenizer = MythosTokenizer()

推理生成

ids = torch.tensor([tokenizer.encode(“Explain quantum computing”)])

output = model.generate(ids, max_new_tokens=512, temperature=0.7)

支持PyTorch FSDP分布式训练，默认使用FineWeb-Edu数据集，开箱即用。

最后

OpenMythos可能不是100%还原Claude Mythos，但它把大模型的“缩放之争”，从堆多少参数推向了推理算多少轮。

770M干翻1.3B，循环深度Transformer，或许就是下一代大模型的破局方向。

22岁开发者，凭一己之力挑战巨头闭源黑箱，这正是开源AI最迷人的地方。

项目地址：https://github.com/kyegomez/OpenMythos

作者：hacking。前北漂程序员，现在做安全。

文章数据来自网络，大模型优化，侵权删。

往期相关回顾

突发！意大利批准：美国引渡中国工程师徐泽伟

DeepSeek现在我是你爹了

苹果突发“社死”现场！一个文件忘删，4万亿AI家底全曝光

体制内vs大厂：当初选“稳”的人，现在后悔了吗？

炸场！2026年4月GitHub爆火11个开源项目，第3个Hermes封神

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：Hacking黑白红 hacking hacking《22岁开发者逆天复现Claude Mythos！GitHub狂揽1.1万Star，CTF挑战成功率73%》